1296、自动驾驶立项
“我们和YouTube现在正在联合研发一款智能识别图片及视频的系统。
研发完成后,它将用于甄别、封禁油管平台上发布的仇恨、种族歧视、血腥、黄/暴及其他违反各国法律规定的图片、视频。”
得知夏景行前来视察工作,吴恩达和李飞飞作为复兴工业(美国)人工智能研究院的正、副院长亲自带着大老板在各个实验室参观了起来。
一行人边走边聊。
夏景行笑着说道:“这段时间辛苦你们了,违禁视频一直是油管的一块心病。
因为这玩意儿,油管经常被社会各界抨击,快被形容成传播毒瘤的网站了。”
吴恩达笑道:“油管每个月有来自几十个国家的几亿人访问和上传视频,这种大型平台的管理确实是件令人头疼的事情。。
光依靠人工审核视频, 很难实现高效的审核,同时还会造成大量的人力支出。
拥有一款高识别精准率的审核系统,可以为油管省很多事。
不过现阶段的AI识别精准率很难达到完全不依赖人工审核的程度。
未来很长一段时间内,还是需要AI和人工一起搭配审核,AI为主,人工为辅。”
夏景行笑了一下, “我明白, 人工智能也会出错,把正常视频判别成违禁视频。”
吴恩达点点头,道:“要想彻底解决这個问题,还需要继续训练我们的算法模型,才能使它的识别更精确。
怎么训练人工智能呢?我们需要更多的标注数据。”
李飞飞在一旁补充道:“我之前曾开发了一个ImageNet数据库,下载了10亿张图片,为了找人标注这些图片,我使用了亚马逊的众包服务平台AMT,但几年时间过去了,仅仅只标注了几百万张图片。”
夏景行微微点头,亚马逊AMT,又名AI富土康。
顾名思义,这就是一个网上接单做兼职的平台,其中最多的任务就是标注数据。
怎么标注呢?很简单,坐在电脑前,对数据进行手工输入、分类,区分出一张照片中是否有“狗”,辨别语句中的“bass”到底是低音还是鲈鱼。
每标注一张图片、一段语音,可以挣3美分。
看起来挣得很少, 但积少成多, IT外包业务发达的印度就有很多家庭妇女把这份兼职工作做成了全职工作,每天工作8小时,一个月能挣700美元。
听起来感觉好像还不错,但其实比工厂打螺丝还枯燥乏味。
不过毕竟是兼职工作,也没人站在旁边督促,想干就干,算是比较自由的工作。
夏景行问道:“我们开发的FXNet数据库,现在标注了多少张照片?”
吴恩达叹了口气,“就一百多万张,因为找不到那么多人干这活,亚马逊AMT上面的活跃用户太少,很多人干着干着就不干了。”
夏景行皱起了眉头,“太少了,标注数据就是人工智能的饲料,要赶紧想个办法把标注数量提升上去。”
说到这,夏景行心中突然一动,脱口而出道:“哎,我们可以考虑把这个产业引入中国啊?
一个月挣四五千块,应该还是能吸引一些人当数据标注员的。”
夏景行一下子联想到了很多东西,西哥可以在老家办个外呼中心,自己也可以在老家办个数据标注中心啊!
找一帮有一定文化基础的妇女,培训一下就可以上岗了,而且还可以在家里干活,相当于补贴家用了。
夏景行把自己的想法给吴恩达和李飞飞讲了一下。
李飞飞老家也是蓉城的,而且这是为妇女提供工作岗位,她对这件事很感兴趣,立马针对性的提出了不少建议。
吴恩达提出了不同意见:“选择众包模式,估计标注员只能标注一些简单的图片。
而视频标注和3D标注有些复杂,每一帧画面都需要标注数据。
尤其是戴伦你提过的自动驾驶,想想都觉得数据量恐怖。”
夏景行记得前世涌现出了一些专业的数据标注公司,他们的主要服务对象就是自动驾驶技术公司。
为了完成一些高质量、高难度的标注,那些数据标注公司没少研究如何高效标注数据的小工具。
“我们可以开发辅助标注工具,把图像和视频进行分割,标注员只需要在每个物体框里面打钩打叉,或者选择绿色、红色就行了。”
吴恩达眼睛顿时一亮,“这是一个好办法啊,不然一个图像标注几百上千组数据,能够把人活活折磨死。”
夏景行笑了一下,这可不是他自己想出来的,而是前世那些数据标注公司总结设计出来的小方法。
众所周知,数据标注越多,投食越多,喂养出来的人工智能就越精准。
开启自动驾驶模式的汽车,需要行驶在复杂的城市路况,这就对人工智能、计算机视觉提出了更高的技术要求。
周边的汽车、道路、指示牌等等,全都需要经过数据标注员无数次的标注,然后将大量的数据汇集在一起,最终才能培养出能够安全上路的自动驾驶汽车。
不过自动驾驶是渐渐走向成熟、精准的一个发展过程,在此之前,估计少不了各种翻车事件。
假如某位车主运气不好,在自动驾驶模式下,遇到了一个没有收录在自动驾驶数据库里的路况场景,机器不认识,那就只能全村开席了。
“说到自动驾驶,戴伦你打算什么时候开始研发这个项目啊?”
吴恩达停下了脚步,李飞飞也站在一旁饶有兴趣的看着夏景行。
“明年吧,先把手里的这摊事给做好。”
吴恩达摇了摇头,微笑说道:“我在学校里听说了,塞巴斯蒂安·特龙带着一群人正在山景城搞一个秘密项目。
他们改装了六辆丰田普锐斯、一辆奥迪TT,给每一辆汽车的车顶都安装了一个支架,上面搭载了一个机械旋转式激光雷达,能够对车身360度方向进行扫描。
车顶的后部还安装有GPS天线,能够协助车辆进行定位。
4颗毫米波雷达分别安装在车辆的前后保险杠以及车头的两侧,前雷达主要用于检测距离和速度……”
夏景行微微皱眉,塞巴斯蒂安·特龙也是斯坦福大学的教授,同时也是谷歌X实验室的创办人。
如果他没猜错的话,对方负责的这个项目就是Waymo,谷歌的自动驾驶品牌。
“你怎么了解得这么清楚啊?”
夏景行突然有些好奇,吴恩达描述的惟妙惟肖的,好像真见过那几辆原型车似的。
“哈哈,因为我见过它们啊!”
吴恩达笑着揭晓了谜底:“特龙前段时间邀请我去参观了他们的原型车,同时还邀请我加入他们团队。”
挖人挖到我头上来了?
这下,夏景行对佩奇的意见更深了。
当然了,他自己是不记得差点挖空谷歌中国这件事的。
夏景行扫了吴恩达一眼,心想对方说这话是什么意思?难道要离开?
他正要说话,被吴恩达抢先一步:“不过我已经拒绝他们了,虽然他们的项目很酷,不过我觉得复兴工业也不差,我们一定可以研发出比他们更智能的自动驾驶技术。”
夏景行终于听懂了,吴恩达想做自动驾驶。
他在心里想了一下,如今谷歌都已经正式下场了,看样子确实不能再等了。
特斯拉目前的主要精力都放在了量产Model S上面,暂时无暇兼顾自动驾驶的研发。
就算特斯拉将来研发了相关技术,也会选择自用,而不是对外开放。
复兴工业想要打造的是自动驾驶全栈服务商,未来将向汽车厂商输出相关软件和硬件技术。
当然了,如果因为复兴汽车的缘故,没友商敢用的话,那就像特斯拉一样自用。
夏景行看了李飞飞一眼,图像和视频识别系统的研发工作可以交给对方领导。
国内的话,沈向阳还在哼哧哼哧的研发手机助手,也就是语音识别技术,未来该技术还可以搭载到平板、汽车、智能音箱等设备上面。
让吴恩达开始做自动驾驶,也不会影响其他项目的研发进度。
反正现在又不缺钱,铆足劲儿砸就完事了。
谷歌X实验室为什么那么牛逼,就是因为砸钱很爽快,什么无脑项目都在搞。
当然了,有项目假如搞成功了,那就是有先见之明。
“好,安德鲁(吴恩达英文名),你尽快招募团队,我们也把自动驾驶的研发工作正式提上日程,需要什么,你直接报给林兵,他会全力配合你。”
见夏景行这么果断的就同意把自动驾驶立项,吴恩达非常的高兴,一个劲儿的表示自己一定不会辜负公司的期望。
夏景行其实想把自动驾驶这么重要的项目弄回国内,但吴恩达出生在伦敦,少年时期长在香港和新加坡,大学是在美国读的,并且已经入美籍了,怕是不愿意到大陆工作。
不过夏景行很快想起吴恩达前世曾加入百度担任首席科学家,参与研发了百度大脑,应该不会抗拒到大陆工作吧?
担心出什么岔子,夏景行又赶紧旁敲侧击了一番。
“安德鲁,你去过大陆吗?”
“当然去过啊,大陆这些年发展很快,我每次去都感觉到了一个新城市。”
“假如公司以后派你回大陆工作几年,你愿不愿意?”
“没问题啊。”
吴恩达丝毫没有犹豫,答应的非常爽快。
见状,夏景行顿时放心了不少,毕竟让吴恩达挑起自动驾驶重担的话,那么他就是核心人物,如果中途出现什么变故的话,会很麻烦,还会拖累研发进度。
夏景行又多解释了一句:“我们的总部始终在大陆,在那里获取数据方便一点。”
吴恩达笑了笑,“戴伦,这些我都懂,一切都听你的安排。”
(https://www.lw00.net/2383/2383112/704218034.html)
1秒记住乐文小说网:www.lw00.net。手机版阅读网址:m.lw00.net