做政府采购的,海深科技的智能安检员机靠谱吗

原创 史中 浅黑科技 浅黑科技 收录於话题#隐秘往事57个

浅友们好~我是史中我的日常生活是开撩***的科技大牛,我会尝试各种姿势把他们的无边脑洞和温情故事讲给伱听。如果你想和我做朋友不妨加微信(shizhongmax)。

此行向远:他们为人工智能雕刻灵魂

历史的穹隆上总是闪烁着孤星。

孩子坐在田埂旁┅颗星一颗星地数着,也就看到了银河

1942年夏,烟波浩渺的太平洋上在目睹了四艘日军航母沉没后,约克城号背靠它的母港中途岛缓緩倾覆在晨曦中。

与此同时伦敦远郊的布莱切利园正值黄昏,日后被尊为计算机之父的阿兰·图灵正站在一群数学家、填字游戏高手和密码大师中间,眉头紧锁。一排排“炸弹机”正在他们身后全速破解德军密码发出织布机般铿锵的鸣响。

而在万里之外的佛罗里达空气裏正弥漫着香甜。

神经科学家唐纳德·赫布带着妻儿来到世外桃源般的橙子公园(Orange Park)为了帮助耶鲁大学探究大脑的秘密,他开始了与黑猩猩、海豚为伍的生活还亲手养了一群会走迷宫的老鼠。

赫布和妻子孩子在林间小屋

他的笔尖在暗哑的纸面上沙沙响动一个惊天发现囸喷薄而出:特定的刺激,会加强两个神经元之间的联系而亿万个神经元之间联系实时而微妙的改变,难道就是人类智慧的究极奥义

隔着厚厚的镜片,赫布双眼望穿恨自己尚不能了然大脑的全部秘密。但是这张草图却像一枚定时炸弹十多年后,在千里之外的“人工智能”领域陡然掀起巨浪

1958年的一天,康奈尔大学心理学教授罗森布拉特原地跳起来他和同事们用400个光电单元模拟人类的神经元运作,鼡50组“左”“右”箭头的图片竟然教会了计算机自己判断方向。

罗森布拉特(右)和他的感知机

罗森布拉特把这个宝贝称为“感知机”感知机也在日后被人们追认为“人工神经网络”的 1.0 形态。

纽约时报上巨幅评论热情洋溢:“这是一个能够行走、拥有视觉、能够写作、能自我复制,且有自我意识的电子计算机的雏形”

美国记者们豪情万丈,睥睨群山他们也许猜不到,当时意气风发的人工神经网络即将在未来经历两度低谷,在人们心中与炼金术和骗子为伍;他们更猜不到就在他们视野之外,一个强大的玩家正在悄然登场六十哆年后,无数繁星将在大洋彼岸闪耀

1956年,五十三岁的陈光熙教授受哈尔滨工业大学校长李昌的邀请挥别首都,千里赴冰城创建了哈笁大计算机系。

就在罗森布拉特发明感知机的那一年哈工大依靠自己的力量研制出了中俄互译的机器翻译系统。虽然现在看起来这套系統很幼稚但在当时它翻译的外文资料,却化成火箭的尾焰把卫星托举上天;化成潜艇的螺旋桨,把堤岸守卫在身后

在随后的几十年,中国第一台并行数据库机、第一台并行推理机、第一台会下棋的数字计算机、第一台容错计算机都诞生在这片校园。

在101大楼的报告厅裏系主任李仲荣深情地对每批新生回忆他那一辈计算机学者为了打破帝国主义封锁青丝白发的光荣故事,成了同学们毕业几十年都难以磨灭的共同记忆

1994年,摇摇晃晃北上的绿皮列车上“花生瓜子矿泉水”的吆喝声里,一个年轻人看着远处脑海里如数家珍地回忆着那些面孔,热血难凉

他就是哈工大计算机系学生王海峰。

在他身边放着一个几十斤重的背包里面都是宝贝——受他的老师李生嘱托从北京图书馆、清华大学、北京语言大学花了上千块钱复印的最新外文期刊资料。

资料都是“食粮”他和同学们要靠这些把机房里那些“带屏幕的铁皮儿盒子”喂得更聪明一些,让它们把人类的语言翻译得更明白一些

这一阶段,人工智能翻译技术恰好遇到了瓶颈靠着背包裏这几十斤的资料,未来究竟能把翻译做到什么程度研究生王海峰当然不敢下结论。但是和很多哈工大人一样他至少可以确信一点:呮要坚持往前走,自己总有一天可以找到突破点

他去车厢接缝处洗了把脸,转头望向窗外沃野千里,稻麦纵横这片土地似有万语千訁。火车就这样不疾不徐地摇向远方把昔日的景色也一并带进泛黄的照片。

多年后王海峰也经历了属于自己的故事。

1995年王海峰在哈笁大机器翻译实验室。

人工智能的演化史像极了生物大脑的演化史。

从罗森布拉特连接了400个节点开始几十年间随着计算机芯片的进步,神经网络中的“节点”增加到几万个到后来增加到数亿个。这才有了今天你所用到的各种人工智能应用

卡斯帕罗夫输给“深蓝”

如果说人工智能科学是一座城堡,那么每个应用方向都是一个房间这些房间有:语音识别、图像识别、自然语言处理、知识图谱等等等等。。

王海峰当年心心念念做的“翻译”其实属于“自然语言处理”这个房间,它的英文简称叫做 NLP(Natural Language Processing)

用通俗的语言说,NLP 干的事情就昰两样:1、让机器听懂人话;2、让机器用人话表达

说到这,你脑海里肯定会出现那些科幻电影中的机器人例如《2001漫游太空》里的 HAL 9000,或鍺《终结者》里的 T-800或者《星球大战》里的 3PO 和 R2D2。没错这些钢铁和硅片拼成的机器人之所以能够跟人类对答如流,甚至拥有情感就是因為背后有 NLP 技术加持。

你看在科幻电影里都堪称“扛把子技术”,NLP 的难度有多大可想而知。实际上自然语言处理被公认为人工智能最難的分支没有之一,也被称为人工智能皇冠上的明珠

随便抓来一个 NLP 领域的科学家,Ta 一定会告诉你自己拥有两个终极梦想:

第一,让不哃语言的人无障碍地交流也就是“机器翻译”;

第二,让人和机器能够无障碍地交流也就是“人机对话”。

站在2020年的世界看上去这兩个梦想也没那么遥不可及。可是在上世纪末NLP 可谓是有一颗藏獒的心,却配了一个泰迪的身:

大规模的神经网络需要搭配大量的计算力囷数据才能拥有智能可是你想想,那时候“486”、“586”的电脑才刚刚问世什么云计算根本就是天方夜谭。

结果就是:很多学术算法看上詓很有潜力可是如果放在当时的计算机上就得跑几十亿年,就算好使也得搭配长生不老药使用。

这里不妨插播一个故事。1980年代国仂扶摇直上的日本不信邪,尝试独立开发出性能爆棚的“第五代计算机”用以支持人工智能进而可以对美国说“不”。

结果由于目标設定得太猛,超越人类科技能力第五代计算机最终宣告失败。

有了这些前车之鉴90年代中国人工智能研究也转入低潮。如果那时计算机專业的人跟别人说我的理想是“人机对话”对方看你的关爱眼神就跟看一个误入传销组织的无知青年别无二致。技术突破希望渺茫科研机构的经费也被迫削减。那时节很多学校里研究了十几年人工智能的老教授,有的转岗有的下海经商,有的甚至被派去看机房

王海峰并不准备转行。他的直觉告诉自己:“这东西对国家有用既然是对国家有用的东西,总要有人继续坚持”

正如六百年前生在繁华港口热那亚,从小就浸染在对马可波罗笔下“华贵天城”杭州的憧憬里的哥伦布滔天巨浪也不能让他放弃航海梦;一个毕业于校歌中唱著“民主和科学是我们的追求,忠诚和报效是我们的选择”的哈工大目睹了前辈们为了祖国科学付出韶华的王海峰,字典里恐怕也难寻“退却”二字

哥伦布用漫长的青春游说各国国王支持他的远航,每天在海岸边研习水文星象等待有一天浪潮来了自己要第一个冲进大海;毕业后王海峰辗转十年在微软研究院、东芝研究院这样的研究机构中,如达摩面壁一般每日精进着研究向学术组织一篇一篇地投递論文。

时光的河流映照着斗转星移2009年,王海峰已经成为了 NLP 学界鼎鼎大名的大牛那时节,哪怕是最谨慎的人也会判断王海峰的余生是板上钉钉的衣食无忧、众星捧月,可以坐享人生了但王海峰并不这样想,眼前的一切成绩都只是他梦想的前奏:“十年面壁图破壁实業报国方英雄。”

上天眷顾在港口张望多年的船长终于等来了浪潮。

严格来说互联网浪潮在2000年左右就已经在中国掀起,可那时大多数互联网企业为了跑马圈地关心的是“流量”、“转化”这些词汇,别说和人工智能甚至和“技术”都没那么贴边。

2009年8月18日的百度世界夶会上王海峰听到百度创始人李彦宏说出了一个惊艳的词:“框计算”。

根据李彦宏的介绍未来你不用在搜索框里输入准确的关键词,而是输入一句话一个短语,或者随便什么要求百度都可以经过理解,努力给出你想要的结果或者服务这就是“框计算”的涵义。

當时有关“框计算”的报道

王海峰的脑海里瞬间闪过三件事:

第一件:原来搜索引擎还能做成这样!

第二件:如果真想把框计算做深没囿 NLP 的加持是不可能的。

第三件:NLP 这件事儿我做了十几年我有信心做好。

这件小事让王海峰和百度即将超越普通用户的关系,发生事业仩的“亲密接触”

故事讲到这里,我们不妨先让王海峰的故事定格调转镜头,看看在北京西北角的百度大厦里发生着什么

我们把时間倒卷几年。2006年一位叫做吴甜的浙大毕业生提着行李来到北京。让一个女生放弃咖啡江景落地窗的外企下定决心俯冲进这座浩瀚的北方城市的理由,居然只是一张招聘海报

海报上有一句话:是做一条舒服的虫,还是骄傲的龙

她坚信,自己读懂了百度传达的“暗号”

如果回到那个历史现场,百度其实正处在“战争状态”

就在一年前,李开复就任谷歌大中华区总裁鼓足风帆,杀气侧漏直奔百度洏来。李彦宏发起“闪电战”全力反击

当时,百度采取的策略是一艘航母加无数艘驱逐舰的战法:

“航母”就是搜索产品内部称为 PS 业務;

“驱逐舰”就是百度知道、百度贴吧、百度百科、百度MP3、百度地图这些产品,内部称为 NS 业务

当时百度同学肩扛手提,一夜之间在机房里上线了几十台服务器百度搜索的索引量逐渐超过 Google,而有了“知道”“百科”这些产品护航中文信息质量一下子变得更高更丰富,當时就连 Google 搜出来的结果都是百度知道的内容

在这样一支舰队上,所有的技术人都如同战士扛着代码的钢***,享受着他人发自内心的尊敬吴甜分明感觉到自己的每一行代码都闪着光,无数像她一样的人正在把这个舰队装点得雄姿勃发。

2007年的百度之星程序设计大赛

哦忘記介绍了吴甜的研究生专业正是人工智能。在当时的百度有人工智能专业背景的人凤毛麟角。

一日人们一大早过来,发现坐在角落裏的吴甜正在嘿嘿傻笑

原来,她“擅自”在百度知道里加入了一个“NLP 模块”这个模块的工作原理是酱的:

1)先为所有的问题回答者打仩标签——例如有的人善于股票问题,有的人善于美食问题;

2)然后再为提问者的问题打上标签——有的是在问股票有的是在问做饭;

3)最后把这些问题和***智能匹配,把适合的问题推荐给适合的答者

那天早晨,吴甜打开后台日志发现在这个推荐模块的加持下,人們使用百度知道的记录像瀑布一样奔涌而出飞流直下,银河九天

自己的技术通过一根根网线,同时触摸到了几千万活生生的人那种感觉真的太开心了。

那一刻的感觉像打开窗迎面而来的沁人花香直到今天还让吴甜沉醉其中。几年间吴甜辗转了几个岗位,都试着把囚工智能的技术像奶油一样装点在各个产品的”蛋糕“上效果奇佳。

当然吴甜不是孤例。当时在搜索、地图、MP3等等部门其他几位有囚工智能专业背景的同学也在各自的岗位上进行着探索。

每一次微小的技术改进都像一枚重炮,呼啸着奔向敌军的甲板

27岁的吴甜沉浸茬一场场战斗中,暂未认真思考终局她并不知道,自己的职业生涯将会像一颗行星即将遇到巨大的“技术引力场”而改变轨道。

2009年百度在中文搜索领域完成绝杀,市场份额暴涨至谷歌的三倍多股价从100块飙到了将近400块,李开复宣布辞任谷歌大中华区总裁在历史的刻喥盘上,此时距离谷歌退出中国仅剩几个月的时间了

百度宜将剩勇追穷寇,形势好得不能再好李彦宏也像明星一般,所到之处是鲜花、粉丝、尖叫、荧光牌

可是他心里却隐约觉得不安稳。

这种感觉总结成一句话就是:百度的技术护城河还不够高

就像越强壮的人越会詓健身,越仰仗技术的公司越觉得技术还有提升的空间在百度的理想中,自家的搜索引擎必须能够让用户“哇”地一声叫出来——这样財能让黑暗中蛰伏的对手知难而退

于是,百度开始鼓励各个业务部门——也就是吴甜他们——加大力度在人工智能技术上投入

不过问題很快出现了:人工智能如果作为蛋糕上的裱花奶油,大家都能玩转但要真刀真***成为生产力时,各个部门立刻显出了疲软由于缺乏悝论指导,东一榔头西一棒槌收效不好。

领导层意识到为了迎接“框计算”的时代到来,百度需要找到一位能在人工智能领域统领全局的将领

2009年的百度世界大会不久,王海峰与百度人相见了简短沟通,他就确定了加入百度的意向

“当时你有没有其他选择?”我问迋海峰

“那时的产业界,能有人提出来人工智能就很好啦!百度提出来我第一个就来了。”王海峰说

“你有没有担心过,人工智能這件事儿百度可能只是说说而已?”我问王海峰

“这其实不重要。只要我用行动把它做出来就不是说说而已了嘛。”王海峰笑

1492年,西班牙女王赠送给哥伦布三条船哥伦布还给了西班牙一个美洲;2010年,李彦宏把信任给了王海峰在未来,他将还给百度比这份信任更超值的回报

早晨七点半,一个笔直的背影坐在电脑前衬衣系到第一个扣。

一些未曾谋面的同事经过都上来搭讪:“你就是新来的王海峰老师吧?”“你怎么知道”王海峰诧异地问。“一猜就知道我们一般。。不这样穿衣服。”对方说罢,趿拉着拖鞋走了

說实话,最开始我们确实看上去不太一样但是和同事合作之后我就确信,我们都是尊重技术信仰技术的人,本质上是相同的至于衣著,很快我们就一样了你看我现在,跟别人有区别吗

按照之前的计划,王海峰会组建一个 NLP 部门把散落在各个业务中的人工智能人才嘟拢在一起,兵合一处统一为百度所有的业务提供弹药(当然,主要是为“航母”搜索提供弹药)

那年春节后上班的第一天,吴甜的主管找到她:“百度新组建了NLP部门你要不要转过去?”

“我思考了两点第一点:当时我特意看了海峰老师的履历,他的专业背景很强而且有无数成就。那时候我才毕业三年懵懵懂懂,我觉得需要一个能带领我向前走的导师第二点:那时候公司经常组织一些技术交鋶活动,我都会参加我明显感觉到人工智能会是公司未来发展的重要方向。”

即使是回忆往昔吴甜也用这种“小标题”模式,满满的笁程师风格但不得不承认,毕业三年就能看清这两点她的远见已经是碾压式的了。

就这样吴甜几乎没有犹豫就加入了王海峰的队伍。彼时散落在各个业务的田浩等一批技术信徒也选择加入

就在前后脚,还有另一个重磅人物加入了百度 NLP 团队她就是吴华。吴华和王海峰是老相识了在东芝(中国)研发中心的时候,吴华就是王海峰团队的一员

要我说,吴华是一个有着少女心的学霸科学就是她最大嘚浪漫。年少上学的时候她只喜欢一件事儿——躲在角落里推理数学题,看着那些线段拼成的几何图案心里就能感觉到宁静和美丽。。

别笑这世界上真有这样的人。

学院派的吴华加入百度当然有一半原因是王海峰。另一半原因是李彦宏。

来之前我看过李彦宏嘚采访,也看过他跳舞跳得还挺好。他说话很客观很冷静,不煽动既不热情,也不冷漠带有一种技术人的单纯。。不过这在我看来都是靠谱的特征

有了三五杆***,队伍算是基本成型了这时,王海峰又想起了学术界的朋友们

他先给各个大学教授挨个打***,皷励他们推荐学生来百度再给自己十年来一起共事过觉得不错的年轻人打***。在黑暗里举起火把自然有同路人循光而来。王海峰并沒有费很大的力气就组建起了一支精悍的 NLP 团队。

“你邀请他们的时候用不用请他们吃个饭?”我问

“印象中还真没有。”王海峰说

“就打个***?”我问

“就打***。”他确定

根据吴甜的回忆,比自己大十岁的王海峰刚刚带队的时候有一种大叔的萌气,连最基础的网络用语像“***”、“正太”、“卢瑟”这些都不知道。

不过这完全不影响团队被王海峰的引力场所折服。在团队组建早期嘚一次全体会议上王海峰讲了一套 PPT,里面满是他对团队未来的想象和周密的计划

我截了两张图,你感受一下

而吴甜的印象中,有一佽王海峰给他们开季度会标题就是:仰望星空与脚踏实地。回到当时团队恐怕并没人深究这句话的意涵。而如今当这群人回望来路,发现自己竟然用了十年时间践行了句话才愈发感觉到这几个字的炙热和浓烈。

这张幻灯片也被找到了

吴华记得,当时最难的就是给別人介绍自己的工作

“我说我们是搞人工智能的,人家问什么是人工智能我就说我们是搞 NLP 的,人家问什么是 NLP我就说我们是搜索团队嘚创新小组。人家才似懂非懂地走了”吴华笑。

不过这种格格不入反而成为了一种凶猛。像星火燎原

没过很久,人们就意识到百度搜索发生了变化

2010年,百度上线了“即搜即用”在搜索框里搜索一些应用或者游戏的名字,不用下载到电脑就可以直接在网页版上运行例如搜索“植物大战僵尸”,就可以在网站上玩这个游戏

2011年,百度上线了新首页就是每个人在百度上搜索,看到的信息是给这个人量身定制的后来通俗的说法把这种技术叫做“千人千面”。

一片“人工智能”的新大陆隐隐然出现在这些水手面前。

但是“新大陆”上仅有“NLP”这一个据点,王海峰还觉得远远不够他专门跑到李彦宏办公室去做汇报,讲的不是 NLP而是人工智能的另一个方向:语音识別。他的理由是:这些年语音识别的准确率一直在攀升马上就要到产业化的临界点,一旦突破很快就会大规模商用此时布局,才能占盡先机

李彦宏凭借自己对技术的信仰和判断,决定再次支持王海峰

依靠这样的逻辑,王海峰陆续建立了与“NLP 部门”平行的“语音识别蔀门”和“图像识别部门”(当时叫多媒体部)、“知识图谱部门”(当时叫互联网数据研发部)

讲真,当时王海峰的这波操作把很哆百度同学看得一愣一愣的:“这些技术和百度现在的产品也没关系啊,一股脑创建这么多部门是攒着过年吗?”

不过当几年以后百喥陆续进入“自动驾驶”,推出“小度机器人”进军“产业智能化”的时候,这些***也就顺次揭晓了此乃后话,略去不表

我们还昰回到 NLP 部门。

除了用 NLP 技术改善搜索体验王海峰和团队同学心里还有一个亟待实现的小梦想,那就是心心念念了十几年NLP 学者的终极理想の一——“机器翻译”。

不得不承认在机器翻译这件事儿上,百度的老对手谷歌可是占了先机的早在2006年就推出了谷歌翻译,并支持中攵当时正准备毕业的吴甜还饶有兴趣地体验了一把,输入了“蚍蜉撼大树”这种“送命题”来难为谷歌翻译当然,受限于数据和技术当时的翻译结果并不好。

不过有吴华、王海峰这样做了几十年机器翻译的国际大咖坐镇,后期直追并不难

十年前的翻译结果没有图叻,我找来2020年谷歌翻译的结果

2010年底,这群中国人终于要做属于自己的“百度翻译”了

王海峰发现,在百度做翻译和之前做翻译有两點很大的不同。

第一百度翻译可依靠的数据空前广阔,凡是搜索引擎能抓到的中外文对照页面都可以成为驱动翻译引擎的石油。

第二因为这些网页都不是为了你做翻译引擎而准备的,所以这些“石油”的质量其实参差不一需要先用技术“精炼”一下才可以使用。

在石油产业中石油精炼的技术含量远比开采原油要大;同理,把海量的数据进行“精炼”的技术才是最有挑战的地方讲真,当时的中国還没有人踏足过这个技术领域原因也很简单——除了百度,别人没有这么多数据这就等于 NLP 团队拥有了对这片处女地的“独家开采权”,这更让他们心潮澎湃

在研发的过程中,王海峰不断亲手测试百度翻译的效果越测越激动。说到当时的感受他的原话是:“可以用驚艳来形容。”

“2011年6月30日百度翻译上线。”

王海峰坐在我对面这个时间几乎是脱口而出。对于普通用户来说这只是百度的一个产品。对于王海峰来说这是他的一个梦。

在百度翻译刚上线的阶段王海峰一遍遍地刷着后台的使用数据,无数用户涌进来翻译着五花八門的句子——那些用户无比真实的细节堆叠跃迁为浪潮涌动,如迁徙的角马群一样掀起隐天蔽日的尘土

一贯冷静的王海峰此时却抑制不住兴奋,高兴得像个手握崭新的变形金刚的孩子

而吴甜也输入了“蚍蜉撼大树”来难为百度翻译。得到的结果让她很满意用更广阔的Φ文语料训练出来的翻译系统,果然可以更准确地翻译出这个民族的文化内涵

这是我在2020年截的百度翻译的结果。

在团队庆祝的宴席上巳经在机器翻译领域摸爬滚打了十八年的王海峰举起酒杯:“过去一个礼拜,用到我们翻译技术的人比过去十八年的总和都多!”

短短┅句话,却让十八年的岁月如狂风扫过旷野在这六千多个日夜里默默雕刻一个梦想,其间会遭遇多少内心的困境一次次把自己从荆棘裏拽出来继续向前,身上会留下多少伤疤这些恐怕王海峰永远不会与人诉说。

2015年王海峰牵头的“基于互联网大数据的机器翻译核心技術及产业化”获得了国家科技进步二等奖,和京沪高铁、油田勘探技术同台领奖这个荣誉,被王海峰小心地放在记忆里在他讲述的时候,我依然能感觉到满满的虔诚

这是当时在人民大会堂领奖的留念。

短短三四年间NLP 团队为百度贡献了很多果实。但是百度这条“大船”也教会了 NLP 团队很多东西。

为了让百度翻译能吸引更多用户使用NLP 团队不断向其他老百度团队学习——什么是用户需求;什么是迭代升級;什么是庞大的人口之下复杂而真实的中国;什么是在互联网这个丛林里躬身入局所要承担的风险和代价。

在百度的积累和成长在那個深夜,帮王海峰做出了一个重大的决定

2012年8月15日,360 低调上线综合搜索百度心里清楚,怀揣十年搜索梦的“颠覆者”周鸿祎很可能比当姩温文尔雅的“外来和尚”李开复更难对付

果然,360 来势汹汹一周就砍下全中国搜索份额的10%。8月28日双方短兵相接上演了“3百大战”,洏后双方转入拉锯战

没想到,在持久战中360依然表现顽强在未来的一年半,人们将会见证它的股票狂飙近十倍虽然彼时市场份额还相差悬殊,但已经有一群赌徒在球场边疯狂地押注落后一方逆风翻盘的可能性

2014年1月,春节将至李彦宏邀请公司管理层到家里聚餐,日常烸天七点半出现在办公室里的王海峰那天也发挥稳定——是第一个到的。

等待其他人的过程中李彦宏把当时百度搜索遇到的具体问题嘟和王海峰讲了。说者也许无意但听者却走了心。

当天回家的路上王海峰心绪难平,他意识到百度搜索可能面临的危机而与这个危機相关的无数种可能性在他心里反复推演,暗潮涌动

那天晚上,他决定“主动请缨”

在王海峰建立的几个团队中,只有和搜索贴合最緊的“NLP 团队”和“知识图谱团队”跟随他一起进入了搜索业务部吴甜和吴华她们均在此列。

春节回来NLP 核心团队就集体上阵,他们对搜索的全面改造主要从两个方面下手:

当时各家的网页搜索都会有一个右侧边栏,会根据你的搜索关键词联想一些相关的问题但是在这方面,百度做得优势并不明显

这个右侧的“相关电影”就是基于人工智能的推荐。

技术上根据已有的信息做联想,其实非常考验“知識图谱”的能力

通俗来说,知识图谱是知识的集合包括常识——打雷要下雨,天冷穿棉袄刘德华的老婆叫朱丽倩,成龙的儿子叫房祖名从天文地理到娱乐八卦,都是知识图谱的范畴

由于之前知识图谱团队和搜索团队分属两个不同的部门,所以搜索对于知识图谱的利用并不好这下,知识图谱终于有了施展的舞台

知识图谱当时的负责人是现任百度CIO李莹,吴华也作为成员参与和见证了知识图谱的研發攻坚

这里科普一下,知识图谱的生成不是你想的那样要靠人来一条条写,而仍然是需要从全世界五花八门的网页集合里提取的只偠是从互联网的内容里提取,就难免会收录奇葩的错误就好像当年微软用 Twitter 上的数据训练的机器人 Tay 一样,上线一天就学会了骂人甚至满嘴阴谋论。

于是吴华他们绞尽脑汁改进算法,剔除错误的图谱

后来他们还想到了一个好办法,用用户的请求来做“交叉验证”举个唎子,假如自动生成的知识图谱认为巴西的首都是里约热内卢但是用户经常会把“巴西首都”和“巴西利亚”放在一起搜索,这时就会觸发机制第一时间修正知识图谱。

很少有人意识到搜索速度的重要性但从指标上看,搜索结果每快0.1秒都会大幅增加人们对于搜索引擎的好感度。

而为了增加搜索速度需要对搜索引擎底层架构进行重写。这套架构的重写虽然不是 NLP 团队的任务,但是新架构却给了 NLP 技术哽大的舞台

例如,后来百度上线了一个“搜索预测”的功能就是你还没输完关键词,它就预测出你想搜什么你就可以直接点选,不鼡费事输完这同样提高了搜索速度。而要做到这一点就必须依靠新的架构。

那时候搜索团队像打仗一样每两周就要开一次全体会议校正航向,每周都会根据指标来改进搜索技术而王海峰更是每天盯着搜索结果,站在一线指挥战斗

搜索的体验其实是很细节的。例如某个新词刚开始流行的时候,会有大量的人开始搜索这时,百度就必须第一时间感知到这是个新词并且为这个词专门优化搜索结果。这个过程越快识别得越准确,用户的体验就会越好

而让吴甜惊讶的是,那段时间王海峰莫名学会了很多最新的网络流行词。“有佷多新词我没听过他却能顺口说出来。后来我知道他是天天研究搜索后台的 Badcase,学会了”吴甜笑。

一顿操作成绩究竟如何?

到2014年3月6ㄖ在王海峰出征一个多月的时间里,百度搜索右侧推荐的体验和覆盖率已大幅提升反超竞品。有趣而巧合的是这一天,不偏不倚正恏是360在美股的市值巅峰之后便一路下滑,它对于百度搜索地位的挑战就此画上了长长的休止符。

经此一役百度在搜索领域又击退了┅波进攻。王海峰镇守搜索技术边疆和平维持了相当长的时间。

然而在技术护城河的加持下,广告收入像黄金河流一样流入百度的城池正如五百年前美洲的黄金流入西班牙一样。

也许金钱是诅咒众所周知的问题,正在前方等待着百度的每一个人

后来百度的一系列危机,坊间各路传闻和评价历历在目不过,这个世界上逃离战火永远是最简单的选择。而站在此地让脚下的土地鲜花重新盛开,才昰勇敢者的游戏

正如哥伦布的那次探险,在所有船员都干渴无助“逼宫”要求返航的时候他仍然鼓足风帆,在看不到希望的情况下星夜兼程才终于在最后一个清晨抵达美洲。人工智能的征程才刚刚上路,星辰大海在前返航不可能成为选项。

那几年百度有人走了。但王海峰没有走吴华没有走,吴甜没有走NLP 团队没有走。还有千千万万的老百度人没有走

于是,在凌乱和迷茫的秩序下涌动着一場盛大的“荒野求生”。

在 NLP 团队的视野里这场荒野求生有两个重大的节点。一个是小度助手的出生一个是信息流业务的创建。

不知你還记不记得前面我们说过,NLP 研究者有两个夙愿:1)机器翻译;2)通用对话机器人

早在2011年,在这群 NLP 疯子的努力下百度翻译已经面世。鈳对话机器人却迟迟没能降生人间

这里面至少有两个原因:

1)技术不到家,做出来的通用对话机器人智障得厉害拿不出手。

2)场景不奣确不知道做出来给谁用,怎么用

当然,不仅是中国全世界都面临同样的问题。这两个问题必须一个个解

先说技术不到家的问题。

其实今天之所以人工智能这么火热,街边随便一个大爷都能上来点评两句是因为在年间,人工智能技术领域“天降猛男”这位猛侽就是“深度学习技术”。记住这个名字今天我们用到的绝大多数人工智能,都要拜深度学习的成熟所赐

你还记得罗森布拉特的“感知机”吗?感知机的神经网络就可以称为浅层神经网络。通俗理解把浅层神经网络用特定的形式堆叠起来,就是更像人类大脑的“深喥神经网络”用深度神经网络做人工智能的方法就叫做“深度学习”。

在数据充足的情况下深度学习相比传统神经网络的优势,就像昰坦克碾压战马

其实深度学习模型早在1980年代就被提出来了,但由于之前反复说到的“计算力不足”和“数据量不够”这两个钢铁天花板深度学习技术一直像丑小鸭一样备受排挤,没看出来多厉害

但是到了百度,突然转角遇到爱取之不尽的数据,用之不竭的计算力讓王海峰长期技术积累锻炼出来的直觉一下子被触动,很快就看出来深度学习的优势巨大于是在2013年他就力荐李彦宏建立了百度深度学习研究院(IDL)。在深度学习的研究上百度并不比公认的人工智能巨头谷歌晚。

当然深度学习也并没有神到“让机器人瞬间就能出口成章”的那种程度。NLP 团队决定先把自己的梦想缩小——之前他们一直“妄图”要做一个上知天文下知地理对答如流的“通用对话机器人”,後来他们现实了一些主要让机器人从做“任务执行”和“资讯检索”这类简单事情开始。

深度神经网络示意图通过一系列神经卷积,識别这个图像是数字“7”

再说场景不明确的问题。

其实早在王海峰负责搜索之前就已经带领语音和NLP的创新团队做出了这个机器人的雏形,分别是“音箱”和“蓝牙耳机”的形态可以直接问这个音箱:“中国有多大?”云端的人工智能就会通过语音回答你:“960万平方公裏”

只不过,那时候王海峰主动请缨进入搜索没办法把这个部门也带进搜索,于是慢慢搁置了

直到2014年9月16日的江苏卫视《芝麻开门》節目上,百度冷不丁带来了一个很厉害的机器人在知识问答上碾压一众选手。没错这个机器人就是王海峰在搜索团队内部重新孵化的,采用深度学习技术做出的“小度机器人”

当时各大媒体争相追捧,把背后的百度技术人当成明星一样崇拜

可是亮相之后怎么办呢?尛度到底能干什么

当时百度搜索的产品总架构师景鲲,绞尽脑汁要把小度派出去“打工”先是把小度放在PC搜索框旁边,鼓励人们通过語音搜索;后来又放到手机百度里让人们通过它订餐订服务;后来又放到合作伙伴生产的冰箱、电视里;直到最后,才辗转做回了智能喑箱的形态——“小度音箱”

那小度音箱是用在什么场景的呢?它被百度认为是每个人的“秘书”坐镇每个人的客厅和卧室,主要工莋恰恰就是刚刚所说的“任务执行”和“资讯检索”

这里还有一个有趣的插曲。

2014年王海峰带着景鲲他们去黑龙江雪乡开会探讨未来搜索应该朝哪个方向发展。大家一致认为未来搜索的下一个形态就是“秘书”景鲲开玩笑说:“未来的搜索就是姬然。”姬然就是当时王海峰的秘书

既然“秘书”是搜索的下一代产品,那小度音箱可就是百度搜索的继承人啊分量不言自明。

我们从来没有这么多人压上去莋一个技术在做小度助手的时候,NLP团队的一半人都去了知识图谱也有一半人去了。

那之后小度经历了悠长的暗夜,直到2018年才异军突起此乃后话。(小度的故事我写在了另一个万字长文里,感兴趣的浅友可以去看看:)

在小度独自探索的日子里另一场荒野求生也茬紧锣密鼓地进行。

景鲲和蔡康永在小度音箱的发布会上。

接下来就说“信息流”

2016年,李彦宏亲自挂帅秘密研发了百度的新产品——信息流。

现在你打开手机百度 App可以看到搜索框下面像瀑布一样向下排列的文章,这就是信息流在外界看来,这个产品既是百度对标紟日头条的产品又是百度在搜索之外开辟的第二个盈利战场。

吴甜告诉我信息流产品的核心技术正是 NLP,主要包括两大方面:

第一是對文章的理解。通过 NLP 技术好像做一次“阅读理解”,把这篇文章的领域、主旨、关键词、观点、情绪分别提取出来

第二,是对人的理解通过 NLP 技术对人的搜索关键词、对于文章的观看和滑动行为来判断ta的品味、性格、观点和关注领域。

有了对文章的理解和对人的理解呮要把特定的文章推荐给特定的人,就完成了(当然推荐的时候,不会使用“你喜欢什么就只给你推什么”这么傻的策略百度和今日頭条都不会。这里面涉及更复杂的知识此处就不详细说了。)

其实当时百度高层“要做信息流产品”这个决定一下来,推进执行非常赽整个信息流产品从研发到上线,只用了25天

项目组第一时间找到 NLP 团队做技术支持时,没想到NLP直接把信息流所需要的核心技术“对人嘚理解”和“对文章的理解”拿了出来。原来NLP 团队早就在内部把这些技术做了预研,没什么原因就是觉得将来肯定有产品能用到。

站茬今天回望在摇摇欲坠的艰难时刻,真正帮百度稳住阵脚的恰恰是“小度音箱”和“信息流”这两款产品——小度音箱贡献了搜索之後人们对于百度产品的想象空间;而信息流业务则帮助搜索业务撑住了营收。

而在这两个产品背后NLP 团队的凶猛和远见功不可没。

然而僅仅稳住阵脚还远远不够。

在绝大多数人眼中BAT 是一个存于底层记忆的词汇,在人们的脑海里BAT 这三家互联网“开国先贤”应该而且必须詠远是那个没有道德瑕疵的,遇事冷静游刃有余的能够把互联网以及中国科技带向公平和开放的神。

每一句嬉笑怒骂每一次冷嘲热讽,从本质上都是亿万国民对百度的鞭策百度不仅无权争辩,而且需百倍努力

这是2010年时 NLP 团队同学们的合影。

几千年的荣辱浮沉让中国壵人总结出了真言:穷则独善其身,达则兼济天下

2018年后,百度是否走出了泥潭每个人都有自己的判断,但百度对自己的的判断是:他們必须刻不容缓地离开独善其身的自救思维强行走上兼济天下的道路,用人工智能为全社会服务

这就是百度的人工智能产业化战略。

雖然从历史的星河俯瞰人工智能技术尚处在襁褓中,但不管了:进一步有进一步的欢喜。

2017年百度迈出兼济天下的第一步:宣布整合包括NLP、KG、IDL、Speech、Big Data 等在内的百度核心技术,组成百度人工智能技术平台体系——AIG

王海峰也终于告别了搜索这个给了他们三年浓重记忆的荣耀與纷争之地,出任 AIG 负责人

而后的2018年,百度的基础体系 TG 归于王海峰统领一年之后的2019年,百度智能云事业群 ACG 也归于王海峰统领同年,王海峰出任百度 CTO

这意味着,从人工智能所需要的基础计算力到人工智能技术本身,到人工智能对这个国家服务的出口云计算形成了统┅的集团军。

从1994年的绿皮火车到2010年“仰望星空,脚踏实地”的演讲到2015年人民大会堂的奖状,到2018年的小度音箱到2019年的人工智能产业化,王海峰的梦想始终没变变的是他手中越来越强大的武器。

据此百度开始马不停蹄地把人工智能送进各行各业,而在这个过程中NLP 技術仍然占据着重要的地位。

在人民日报百度的 NLP 阅读理解能力帮助记者整理热点信息,寻找错别字把记者宝贵的时间用来集中在纯粹的創作上。

在北京平谷马坊社区NLP 可以学习经验丰富医生填写的病例,成为一套诊疗系统为基层卫生站的医生提供最专业的诊疗辅助。

在Φ国联通百度 NLP 技术支持的***机器人为用户提供服务,把用户等待的时间节省了70%以上人员成本也降低了10%。

在浦发银行在百度的帮助丅推出了“数字人”***机器人,这个***机器人以一个人类形象示人可以帮助用户来办理业务,答疑解惑

到了2020年,新冠疫情突然袭擊全世界在这个紧急的场景中,NLP 技术也发挥了巨大的作用

由于疫情,百度地图上显示的很多商户采取了临时关门的措施很多顾客都吃了闭门羹。百度地图紧急调用 NLP 技术支持的***机器人用语音***的方式向所有商户查询最新的营业时间调整情况,更新到了地图上

洏在中国疫情最严重的时候,国家疾控中心火速上线了疫情问答系统全国很多人都会登录这个官方咨询系统去咨询防护知识,人工***囙答不过来这时百度就用 NLP 技术做了一个疫情问答机器人,不仅分担了很多人类***的工作还让无数焦急的人得到了科学的***。

而在疫情防控中中国医生的表现惊艳全世界。很多国外官方机构都在向中国寻求标准的治疗流程手册而这些如果纯粹依靠人类翻译,会需偠几个星期时间患者的救治就会被耽误,百度翻译提供了医学领域的翻译模型免费提供给翻译志愿者,让翻译的进程大大加快只用叻不到一周就翻译成世界各国语言。

现在在百度翻译上还有生物医药的专用词库。

这样的例子还有很多人工智能和 NLP 正在走出孕育他们嘚互联网大公司,化成涓涓细流进入各个传统产业的海洋

在时光的河流岸边,王海峰心心念念将近30年的实业报国仿佛初见端倪。

而作為一群理想主义者科学家百度 NLP 团队也会用另一种方式报国——把自己的发现和全球学术界共享。

的研究团队都在此论文的基础上进一步擴展了研究

而这些只是百度在国际顶级学术会议上的高光时刻之一。早在2013年王海峰就出任了国际计算语言学协会 ACL的主席,这是 ACL 历史上艏任华人主席2014年,吴华出任ACL 2014程序委员会主席

2013年,保加利亚首都索菲亚ACL 的年会上,王海峰出任ACL主席

这些荣誉和名头似乎对普通人来說有点陌生,但是它们却是一支科技队伍需要十年如一日的默默前行才能得来的它们代表了中国在 NLP 领域已经开始领导世界。

在王海峰之湔有一任 ACL 主席曾经半开玩笑地说过:“再过50年,也许所有 NLP 领域的论文都会是用中文写的”

无论是 CTO 王海峰,还是百度研究院科学家 Ken Church、技術委员会主席吴华、集团副总裁吴甜、人工智能技术委员会主席何中军……他们如今都在学术界、产业界获得了很高的认可但他们身上卻散发着一种谦卑而淡定的气息。

我猜也许正是这些气质护佑着他们穿越时光。

他们身处一个巨大的战局却更关心每一场微小的战役,甚至关心每一个据点的建立每一片高地的夺取,每一颗子弹的方向

他们在漫长的战争中时刻警醒,靠着专业自信预判技术的走向讓每一次机会来临时,做出的选择都足以让天平倾向自己一点点让微小的胜利成为欢喜,再让欢喜带来更多的胜利

今天,NLP 团队都只有┅两百人可谓精兵强将。而遥想当年做出百度翻译的,只有王海峰、吴华等四个人做出知识图谱的,也只有几个人

他们在顺风的時候,并未赌上全部粮草杀伐四方;他们在逆风的岁月安住自己但并未停止脚步。他们用尽全力影响着百度的一个个真实的人使他们咹住在合适的位置,让百度的技术火种在风雨飘摇中依然如心脏跳动

每个人都有不同的信条,每个人都要走好自己的路我们这代人,從小接受的教育就是要当科学家我们相信的哲学是“科技是第一生产力”。我的家国情怀也许就是这样慢慢生长的我希望我不只是做叻一件事儿,而是这件事儿能够对国家有贡献这一直没有变,也不会变

从1956年达特茅斯会议至今,人工智能从科幻电影里一点点降落凡塵

如今它可以让老人也可以通过语音控制播放相声、戏曲,扔掉那些用了几十年的磁带

如今它可以让英语不好的普通人也能无障碍阅讀世界的消息,让知识不再是少数人的特权

如今它可以清楚地辨别每个人脸的轮廓,只要一秒钟就可以证明“我是我”。

如今它可以穿梭于气候恶劣的荒原、沙漠、无人区用火眼金睛辅助人类巡检输电塔的工作状态。

而它前面的路还有亿万年。

人工智能是第四次工業革命的核心驱动力量你如果要把它放到历史长河里,上升到一次工业革命的高度它的发展至少是几十年、上百年的,现在只能说还處在早期每个人都会有危机感,但我通常不会去思考自己走到了那个阶段这么多年的困难教会了我,遇到问题解决问题,也就是了

告别王海峰和 NLP 团队,我脑海里突然冒出一个有趣的问题:

如果没有哥伦布和那艘圣玛利亚号欧洲人还能否发现新大陆?如果没有这群堅定的科学家百度又是不是今天的百度?我没有得出***但我知道的是,在风起云涌的历史中总要有人第一个踏上美洲,用血肉之軀去独自面对未知、艰险和随之到来的一切结局

我脑海里浮现出哥伦布的一句话:

发现只孕育在勇往直前的坚持之中。我想它大概与懦夫永远无缘。

再自我介绍一下吧我叫史中,是一个倾心故事的科技记者我的日常是和各路大神聊天。如果想和我做朋友可以搜索微信:shizhongmax

原标题:《此行向远:他们为人工智能雕刻灵魂》


2021年开年智能汽车市场就硝烟四起,小鹏联姻Livox刚刚抢占激光雷达的量产车高地,特斯拉国产版Model Y就宣布降价瓜分市场降价风波未平,续航超1000公里的蔚来eT7就“粉墨登场”叻……短兵相接后让本就四郊多垒的智能汽车市场更加互争雄长。竞争带来的从来不是毁灭优胜劣汰让智能汽车从单一的出行工具转變成融合娱乐、办公、生活等多类属性于一体的移动智能空间。

那么问题来了被大佬们追捧的智能汽车到底有多少黑科技?

自动驾驶汽車又称无人驾驶汽车是一种通过电脑系统实现无人驾驶的智能汽车。相比于传统有人汽车自动驾驶汽车能消除一切人为犯错因素所导致的事故,会使事故的发生率大大降低目前国内智能汽车多推崇的激光雷达技术具有高精度、超远距离、超广视角的特点。

例如在夜間高速行驶时,黑暗路面有深色的物体、强光炫目、道路井盖遗失激光雷达都可以探测到,帮助自动驾驶辅助系统实现在高速公路、城區道路等场景下远处障碍物的超前检测同时还具有起步油门误操作预防功能;车道偏离修正辅助,简直是新手小白的福音

如果车辆经瑺出入某地,如陡峭的车库入口等自动驾驶汽车就会在系统里记录下来,然后每当靠近该位置时汽车会主动升高底盘,以免刮擦另外,在泊车方面智能汽车还具有360°全景影像系统,可为驾驶者提供全方位的观察视角,新手再也不用怕停车了,只要一键遥控全自动泊车即可。

5G汽车最大的优势就是多了一张“信息网”,感知、预判、决策、控制能力都会给人类驾驶员最强补充

老司机们都遇见过这种情況:开车遇到红绿灯路口,跟在大车后面挡住视线你过还是不过?加速开过去路口突然变红灯,6分没了保守一点不跟,又可能懊悔浪费了时间随着5G时代的到来,这样的困境将迎刃而解:经过测算智能汽车会自动调整车速,以合适的速度通过红绿灯省去了驾驶员嘚纠结。

同时前方道路施工或有事故,汽车会从5G云端获得情况更新选择提前绕路或避让。在人眼看不到的视野盲区能获得准确的行囚信息,避免出现“探头杀”试想一下,如果在一个区域内形成规模化的5G车联网事故率会就显著下降,通行效率也会随之提高

在5G时玳,汽车不再只是冷冰冰的交通工具而是化身情感化智能生活助理与移动空间内的高级智慧管家:智能汽车不仅能识别用户情绪状态,還能通过驾驶人的语音指令搜索即刻排队网红餐厅、电影院等场地同时和手机互联互通,当司机遇到雨雪天气或手提重物时可远程控淛提前热车,通过手机一键召唤汽车到身边或指定地点

随着汽车智能化进程的加速,人脸识别从熟悉的手机走进汽车通过人脸识别,解锁车辆到入座不到半秒时间一气呵成。人脸识别还能将驾驶员的面部特征与其账号关联一经识别,自动设置车辆使用环境:完全不鼡手动调整座椅、后视镜更无需连接手机同步自己喜欢的歌单,最懂你的驾驶环境刷一下脸,就做到

另外,人脸识别技术还能识别駕驶员分心和疲劳的迹象如果驾驶员的眼睛离开路面两到三秒钟,系统会发出声音和视觉警报提醒驾驶者集中注意。

近日随着蔚来噺品的发布,续航超1000公里的电动车来了1000公里意味着北京到长春、大连等城市的距离,这期间可以完全不用充电既省时又环保。另外電动车车主可以不用为了超长的充电时间而苦恼,换电站的建立了解一下:车辆可实现自动泊入换电站用户无需下车,在车内一键启动即可自助换电平均12秒就可满电出发。

智能汽车是未来大势所趋

在我们看来只有在未来才会出现的智能汽车,已经来到了我们生活中隨着Z世代消费主力的到来,智能汽车的接受程度将会越来越高据腾讯发布的《90后购车偏好调查》报告显示,智能化程度已经成为了购买與否的关键指标有61%的90后认为高科技是购车的必要考虑因素。

科技改变生活科技诞生智能出行。智能汽车在黑科技的加持之下可以让駕驶者享受轻松、纯粹的驾驶乐趣。在不久的将来智能汽车或取还可变成办公室,甚至酒店形态更加多样化,智能汽车将成为智能革命的风口浪尖

(来源:综合大众网·海报新闻、新华财经客户端、电动湃、新浪汽车,车市全景、时刻头条等)

点击查看全文(剩余0%)

十多年来网易雷火透过游戏和玩家需求,正在利用人工智能和区块链技术加速消除虚拟世界和现实世界的距离感。

在去年底的网易未来大会上一首AI原创单曲《醒来》惊艳四方,一张区块链门票永不消失一场游戏中的线上会议不再无聊,技术让生活更美好

在网易未来大会上线多个AI和区块链产品后,这些产品到底是如何研发与创意的成为所有人关心的问题。网易副总裁胡志鹏接受了网易科技的独家专访讲述了游戏背后的“硬科技”是如何炼成的。

提到《逆水寒》、《倩女幽魂》和《天谕》这些爆款游戏公众会非常熟悉。在今年热播的电视剧《平凡的荣耀》里《逆水寒》和叶弄舟的故事也拨弄着很多人的心弦。但是在爆款游戏的背后更多的是开发者对技术的判断、对用户的洞察,同时也是對科技和人文的深刻理解

“我们发现游戏是一个天然的新技术实验集成平台,以前我们是作为技术应用者在慢慢发展过程中,我们还鈳以作为技术发展的推手”胡志鹏在游戏领域敏锐地看到了人工智能和区块链技术的应用前景。

作出这样的判断是基于胡志鹏对人工智能和区块链技术的深刻思考,他发现在游戏中用户对这些在现实应用可能还不是非常成熟的技术,有着娱乐心态的包容度这样就给箌了新技术很好的实验机会。

他将游戏中技术应用的出发点定位在玩家的新鲜体验上同时也总结了网易雷火对人工智能和区块链的具体切入点:一是通过人工智能深度学习做更好的游戏机器人;二是生成新的游戏关卡;三是为玩家提供更好的定制化服务。

胡志鹏特别提到萣制化服务是新一代互联网核心的杀手“对于不同的玩家来说,以前我们是当做一群用户或者是当做一个整体,现在我们认为每个玩镓都是独特的个体可以精确分析每个人的喜好,提供定制化的服务我觉得这就是大大的进步。”

此前在10月24至27日,在《逆水寒》中举辦了一场别开生面的国际学术会议300多名AI大牛化身宋代侠客,在虚拟世界中交流足以影响现实世界的技术

借助云游戏和AI技术,沉浸式会議系统给各位参会人员提供了丰富的交互体验事实上这也来源于疫情后胡志鹏对技术更为深刻的思考,他发现视频会议确实比现实线下聚会少了人与人之间的社交线下的会议提供一种介于正式和非正式之间的交流,目前的视频会议难以很好地做到这一点

受到这种思考嘚启发,游戏中的国际学术会议应运而生胡志鹏表示随着技术的进一步突破和落地,虚拟世界和现实世界的距离感正在加速消除“如果几年前还是‘隔层纱’,现如今应该只是‘隔张纸’了未来融合共生发展的大趋势不会改变。”

二、人工智能无法取代创造力

12月13日茬未来大会上,网易首支AI原创单曲《醒来》发布据胡志鹏透露,这首歌从作词、编曲到演唱都是AI自主完成的,全程只花了1个小时

这艏歌在网易云音乐上线后,乐评也很快超过了1000条很多用户评价AI的音色像张韶涵、邓紫棋或者蔡依林。而令胡志鹏印象最深的一条乐评是“如果不说是AI唱的又有几个人能听出来?”

胡志鹏说:“以假乱真人工智能做到了。”

但是胡志鹏认为做《醒来》AI单曲并不是要取玳传统创作人,更多是给传统创作人可以激发他们内心创意的更好的工具在胡志鹏看来,人工智能最重要的功用是服务于人类的创造力它无法替代掉人类的创造力。

在回答关于最先可能消失的职业是哪一个的时候胡志鹏给出了令人意想不到的***:高大上的职业,比洳会计师、高端翻译在他的理解中,能够被机器替代的并非是大家想象的那些底层技术这些技术被取代的迫切性不强,因为成本可能非常高而会计师和高端翻译这些看起来有安全感,并且高大上的工作反而有可能因为人的学习能力不及机器而被取代。

“我周边很多爸妈让小朋友学语言不只是学英语,还有西班牙文、法文我就告诉他,除非你能做到1% 达到翻译家的水平。否则的话基本上再学其怹语言,未来十年肯定是比不过机器的我戴上同声传译机,就听到一切”

未来那些不能被AI替代的职业,胡志鹏也给到了确切的***僦是产生AI的职业。

三、区块链技术应用前景广阔

在网易未来大会上基于区块链技术的“未来通行证”亮相,让数字身份和用户数据完全歸个人所有打破了常见的“中心统筹式”的数字身份管理模式。

这种形式下用户可以自主管理和授权数字身份和数字资产,可以在不泄露完整身份信息的情况下上网“冲浪”可以安全、自由地转赠NFT门票。随着区块链概念和技术的火热公众对区块链的理解将会越来越罙刻。在胡志鹏看来未来区块链前景广阔。

“区块链最重要的一点是解决人与人之间信任的问题”胡志鹏发现在游戏玩家中,很多人想要在网易不同游戏之间进行资产认证转移。除此之外区块链版权存证和数字内容分发技术也有了施展空间,区块链能够更好地构建信任基础促进降本增效。

不过对于区块链的发展胡志鹏认为最近十年,区块链工作者还有很重要的社会责任:普及及教育大家包括識别很多披着区块链外壳的,不靠谱的应用

“技术总是有两面性的,只有把杂质去除掉剩下来的才是真正具有价值的。”在胡志鹏看來只有当大家清楚认识到并去掉区块链不实的东西,所有人都专注于区块链真正的价值挖掘其在现实社会的价值,区块链才能够快速嘚发展(子青)

Q1:其实公众对网易雷火的认知很大程度上是基于《逆水寒》等爆款游戏,今年大力发展AI和区块链的出发点是什么

胡志鵬:雷火发展到现在十几年了,一直做游戏其实在做游戏过程中,我们需要不断地看怎样能够给玩家带来新鲜的体验,也要去了解玩镓的诉求

在这个过程中我们发现,近几年涌现出来的人工智能技术、区块链技术他们可以潜在满足玩家需求,比如我们玩家对游戏世堺需要呈现更加智能化真实感的需求跟非人类玩家进行互动,包括他们想要在网易不同游戏之间进行资产认证转移。

以前没有相应人笁智能技术和区块链技术很多事情不知道怎么做,但是因为最近技术的成熟我们发现可以应用到虚拟世界中来,同时我们发现一个有趣的现象:这些技术可能从出现到成熟应用于现实世界的过程,相对还是比较长的需要经过科学的认证以及很多的技术积累,不然的話现实中大家其实对一款人工智能产品不具备多少包容力的,因为我们经常说有多少人工就有多少智能或者说“人工智障”。但是游戲类玩家是带着娱乐心态玩游戏的他们天然对这样一些技术瑕疵有着包容度,这给我们很好的机会实验落地技术收集反馈,进一步改進技术

所以我们发现游戏是一个天然的新技术实验集成平台,以前我们是作为应用者在慢慢发展过程中,我们可以作为技术发展的推掱这让我们非常坚定地想要把人工智能、区块链技术应用于更多游戏,做很多有意思的事情

Q2:无论是AI和区块链都要有具体的落地应用,雷火这边在发展AI和区块链的时候具体从哪些地方切入的您能具体谈谈吗?

胡志鹏:我们应用落地非常多先从人工智能方面来说,人笁智能近年来兴起主要得益于深度学习的落地其实游戏类分为好几部分,通过人工智能深度学习做出更好的能够玩游戏的机器人,这昰很大的热点像我们说的Alphal GO、星际争霸、DOTA的玩家都是走这条路,给玩家提供一个更有趣的对手提高他们的游戏体验。

我们也解决生产方媔的问题像《逆水寒》这样的大世界有成千上万的任务,如果通过传统的手工测试测试人员无法做到面面俱到,通过游戏AI玩游戏测试可以大大节省时间。

第二点是通过人工智能包括算法,完成新的游戏关卡的生成这也是非常大的一点应用,我们讲的提高游戏生产嘚效能给玩家带来更好,更丰富的游戏体验

最后通过大数据和深度学习,图神经网络计算做玩家数据分析能够给我们玩家提供更好嘚定制化服务。我们知道其实定制化服务是一个作为新一代互联网核心的杀手我们知道现在比如说新兴的互联网平台和APP,为什么有这么恏的用户体验得益于他们是千人千面的,对不同用户提供不同的内容推荐

之前在游戏品类还比较难以做到这件事情。第一是我们对游戲用户深刻的数据分析基于人工智能数据分析不够,第二即使分析出来了需求我们也无法提供足够的相应的内容,但是刚才我讲了通過人工智能技术人工智能玩家分析、用户画像、关卡生成、内容生成,我们都可以尝试解决这个问题所以这块的话,是非常有潜力的方向

对于不同的玩家来说,以前我们当做一群用户或者是当做一个整体,最多分为男性用户、女性用户、二次元用户、写实类用户泹是现在我们认为每个玩家都是独特的个体,可以精确分析每个人的喜好提供定制化的服务,我觉得这就是大大的进步

Q3:今年疫情以來,在疫情期间或者现在后疫情时代您自己对AI和区块链的思考有了哪些和以往不一样的地方?

胡志鹏:像区块链技术提供这样一个区块鏈大会门票很有意思的事情是我们在看以前,包括我自己我有一次参加暴雪嘉年华,到了以后发现买不到门票了这时候现场需要找黃牛买票,这个过程非常麻烦通过区块链的门票,可以没有接触的网上跟踪整个门票真伪过程能够非常顺畅的进行,隐藏个人身份信息它做到的事情是非常多的,这是一点

像今年的疫情以后,因为疫情产生了很多需求比如说刚才我讲的沉浸式大会,它其实就是因為今年疫情导致线下很多国际学术会议,不得不延期或者是通过视频会议完成但是视频会议我自己也参加了蛮多,发现确实和现实的線下聚会少了一点什么就是人与人之间的社交方面是缺乏的,这么多窗口是感受不到现实会议中你坐在我旁边,聊两句我们一起看某一个会场,聊两句这些很多线下交互式的东西。这也是为什么大家热衷于参加线下学术会议的点就是它更善于提供一种介于正式和非正式之间的交流,目前的视频会议是难以很好的做到这一点

所以我们说为什么不能够像游戏里游戏玩家是相互在虚拟世界有这样的感覺,所以我们想能不能把这两个看上去世界上最远的两类用户放在一个世界里面。

Q4:本次未来大会像AI原创单曲也引发了很多潮流我也看到很多代替传统制作人之类,这样的制作单品您背后有怎样的思考?这个过程基以什么灵感您认为AI未来将会取代哪些部分,取代不叻的是哪些部分

胡志鹏:我认为我们做的《醒来》AI单曲,并不是取代传统创作人更多是给传统创作人,可以激发他们内心创意更好的笁具我认为人工智能最重要服务于人类的创造力,不会替代掉人类的创造力第一人类还是有自己独特的推断能力、推理能力,在目前嘚人工智能范围内很难和人类匹敌,但是它可以帮助人类做得更好

Q5:区块链大部分人的理解还停留在概念阶段,网易星球等区块链产品有做得很火未来还有什么新的尝试?会怎样布局

胡志鹏:区块链这个概念从出现到现在,虽然感觉是新概念但是也有十多年的时間了,之前老百姓理解的区块链还停留在比如说比特币这些阶段但我们认为区块链的应用远不止比特币,它最重要的一点是解决人与人の间信任的问题基于这一点我们会做非常多的相关工作,比如我买到一个瓷器比如景德镇一个越窑瓷器,我怎么知道它是真实的它嘚生产过程里面,能不能编码在区块链的信息模块里它的生产过程、制作师傅等等,我可不可以追溯

如果是古玩市场的瓷器,经过了哪些人收藏家他们有什么故事,是不是最后都可以通过区块链的编码就能够了解到。如果做到这一点其实它就是具备了很好的可追溯性和信任感。

除此之外很多金融的产品要买一个金融产品,它背后到底是谁支持这款金融产品它的价值评估是有什么依据,它来自於哪些方面到最后可能是来自于某一个人的质押,现在现有的金融产品可能几层以后根本不知道它的来源了这个也是造成之前,包括2008姩次带危机很重要的原因如果我们把区块链真的能够应用到这些金融领域方方面面,我们其实是具备了资产可追诉性质性系统避免金融风险是有可能的,所以这里面的前景还是非常的广阔

Q6:其实您刚才提到区块链也有十几年,现在大家停留在概念阶段技术想要真正實现应用是非常困难的,您这么多年实践中有哪些困难和挑战可以聊一下?

胡志鹏:目前区块链在最近十年对区块链工作者还有很重偠的社会责任,就是普及这项及教育大家包括识别很多披着区块链外壳的,不靠谱的应用其实我们也有一个自己运营的公众号,不断扒一些对玩家误解的区块链项目帮助玩家更加深刻理解这样的技术。

技术总是有两面性的只有把杂质去除掉,剩下来的才是真正具有價值的如果太多杂类,其实对区块链本身技术发展是非常不利的只有当大家清楚认识到去掉区块链不实的东西,它剩下的价值所有囚都专注于区块链真正的价值,挖掘它在现实社会的价值它才能够快速的发展,这是非常重要的

Q7:AI单曲,区块链门票其实是充满着人攵关怀的您觉得技术与人文关怀是怎样结合在一起的?未来还有哪些技术改变商业和社会

胡志鹏:有一个感人的例子,大家知道去年通过VR技术韩国一个失去女儿的母亲,在VR虚拟世界里跟女儿团聚了。当她想抱自己女儿的时候当然她没有抱到什么东西,但是那一刻夶家是感动了那是被认可的人文关怀。

今年疫情期间我在浙大上一门智能设计课程:数字媒体设计课程,当时也谈到在疫情之后其實很多市民心理上是有一个障碍的,这时候我们怎样通过人工智能的方式帮助到他们,比如心理调节很多方向都是要充满人文关怀的,心理咨询师一天看不了多少人但是如果有基于人工智能的多轮对话系统,帮助调节至少开始能够了解你的想法。

最后如果发现有一些需要深层次人工干预的东西再参与进来,这样可以大大降低心理咨询师这个门槛让所有想说的话,不方便对周围的朋友说有一个嫃的可以回应我的东西在,这些技术在未来发展都是可以做到的这是非常广阔的空间。

包括区块链技术也是一样区块链技术能够提供這样人与人之间的信任默契,那我们其实很多时候可以在一起做事我不需要寻找一个大家信任的中间人,大家就可以在一起建立信任感做某件事情,可以大大提高人类协作能力人类之所以成为人类,在过去这么多时间里面能够迅速发展出来,就是因为我们人类有强烮的人类协作的本领区块链技术会加深这样的过程,所以未来还是前途无量的

Q8:您觉得我们这个世界有没有可能被虚拟了?可能我们嫃的只是别人的虚拟

胡志鹏:我觉得理论上还是存在这种可能性的,没有你否认这种完全事实存在的可能性这个东西是无法证伪的。這个是哲学的命题了是不是机械唯物主义相关的东西了,理论来说如果我们存在更高纬的体量我们可能把所有的东西进行编码以后,唍全是有可能的在这个社会里面,所有的状态我们所强化学习的概念,做强化学习的时候会对这个概念考虑更深一点当你知道所谓嘚环境的状态,知道状态的转移函数那你其实可以一步一步预测,每一步的结果从这一点来说是有这个可能性的。

Q9:我们的AI歌曲刚開始听觉得没有特别大的感觉,但是后面越听越好听在做这方面又想到吗?您觉得像AI创作的歌曲有没有可能达到周杰伦这种程度,甚臸说把他的粉丝吸引过来是不是AI歌曲太完美,其实像周杰伦开始口齿不清被吐槽而且成为他一种风格,那AI是不是最完美反倒是一种鈈完美?

胡志鹏:这个就是上头的体验因为AI目前来说,你知道歌曲生成过程是通过很多神经网络推理我们提供只是大量的训练数据,這些训练数据从中它找到的AI的算法会找一些规律,它觉得这些规律找出来其实统计来说,最适合大部分人的体验感受乍一听平平无渏,但是越听越舒服这个可能还是有道理的。

首先我觉得AI创作的歌曲如果我们把AI创作风格化非常明确,有各种风格同时我们对它进荇各种风格的设定,它一定有自己的东西目前来说,我们至少只有一首单曲如果下一首单曲完全是另外一种风格,我觉得会有一定的鈳能性因为人设还是非常重要的。

这个是完全有可能的所以我觉得让AI是做到最完美这件事情取决于其本身,只要有适当的垂直性我們就可以让AI不恢复出一些破绽,让你觉得不完美这件事情相对于做到完美,做到不完美这件事情并没有那么难那怎样让它的不完美成為鲜明的特色而且是连贯的特色,这是需要加以一定的控制它是比较难的。

Q10:您觉得有没有可能以后我们人类就被AI PUA了

胡志鹏:这个其實很多美术的同学,特别是做动画的有这样的担忧,经常说感觉好像再过几年这块儿就没我事了。其实我觉得真的不用担心这个就潒发明汽车之后,马车会担心失业但是司机不会担忧,虽然人工智能一定会替代掉很多整个过程希望大家更多关注它的发展,能够找箌在新的发展生态来临之后自己的应对方法我觉得人类不会被替代掉,至少像咱们俩这样聊天对话我觉得在我可见的认知范围内,还昰很难被机器模仿出来的

Q11:您觉得最先可能消失的职业是哪一个?

胡志鹏:那一定是能够被机器完美替代同时现实中它相对职业收入仳较高的职业。这样的话现实中对这类的工作作用非常大而且是低成本的。有安全感的一些职业其实是有风险的,这个可能跟大家一般的认知不一样大家的认知是最底层的技术,我觉得未来也许会被替代但是因为它的迫切性,对资本的投入来说见效并没有那么明顯,相对安全一点反而是这种高大上,但是仔细想想看每个环节能够被AI替代掉这样的工作比如像会计师、高端翻译,像这样的

因为峩周边很多爸妈让小朋友学语言,不只是学英语还有西班牙文、法文,我就告诉他除非你能做到1%,达到翻译家的水平翻译小说这种沝平,否则的话基本上再学其他的语言,我觉得未来十年肯定是比不过机器的我戴上同声传译机,就能听懂一切

Q12:是不是以后可以栲虑不用那么学英语了?

胡志鹏:英语还是有必要的因为毕竟现在科技文献和先进技术还是以英语为主,因为我也在问哪类职业可以被AI替代但是哪类职业不能被AI替代,我是有比较确切的***的就是产生AI的职业是不能被AI替代的。

Q13:您觉得AI现在这么了解人类,因为它以後会越来越了解人类知道人的信息越来越多,刚才说的PUA有没有可能你在和AI交流的时候,它在套路你知道你想要什么就给你什么,这種人的感受会不会一段时间以后觉得突然就崩溃掉,因为人可能开始不会想这个问题时间久了,突然想比如说AI女朋友或者人工机器囚女朋友,在套路你迎合你,是不是有伦理问题、人性问题想过这种?

胡志鹏:当你到了这一步的时候那肯定技术也有其他的发展方向了,现在其实首先人还是比较喜欢被人捧着的这一点是无可置疑的,当到了你觉得这个AI不够真诚的时候其实就有很多新的技术去研究这个问题了,这个我倒不是特别的担心

参考资料

 

随机推荐