bob客户端下载对话王小川:通用人工智能是一次文艺复兴

  bob客户端下载ChatGPT火遍全球,国内兴起AI大模型创业风潮时,王小川在业内私下讨论中被频频谈起——从他的人生经历上看,似乎是做AI大模型的天选之人:清华大学计算机系出身,创办搜狗搜索,而搜索、输入法、语音识别、同传……这一系列业务都植根于AI技术。

  王小川还是一名颇为灵验的技术预言家。AlphaGo展开人机大战之前,他曾经和几位AI大佬打赌,预测AlphaGo会赢。他在2016年的时候,就称搜索的未来就是问答机器人,还说当机器掌握语言之后,强人工智能就到来了。这些预测都对了,但是打开通用人工智能大门的那个人并不是他。

  离开相伴21年的搜狗,他感到遗憾吗?在经历了疫情、淡出公众视野两年后,这个原本情绪浓烈的问题,变得似乎不再重要。在这次AI大模型浪潮中回归的王小川说,没有什么遗憾的。AI的机会会超越搜索,这对我们来说反而是一个机会,一个重来的时刻,包袱更轻了。

  王小川的新公司百川智能沉淀着他的旧历史:与他一起创业的有不少搜狗的老班底,比如前搜狗COO茹立云,还有老同事想带资加入;已获得5000万美元天使轮启动资金,来自王小川与其业内好友的个人支持。

  我们有信心,在年底做出中国最好的大语言模型。王小川强调。不过,在听说北京就有二十家大模型公司的当下,他也需要帮助,你们能在文章里放上我们的招聘邮箱吗?他问36氪。(见文末)

  带着许多问题,36氪专访了王小川。但近期关于AI大模型的采访都有其尴尬的一面:在ChatGPT的热潮中,基础的认知鸿沟已经迅速被抹平;而在36氪近期密集访谈AI创业者们时,由于大家都刚刚起步,可讨论的话题范围相当有限——要么过于初阶,要么过于遥远。

  对于眼前,王小川展示了一种实干家的态度——与其讨论困难、失败,不如撸起袖子、把事做成——对于未来,他带着一种技术派的浪漫,每个人都成为自己更想做的人。这会是一次文艺复兴。

  36氪:ChatGPT火遍业界的时候,我们当时就讨论,王小川不应该缺席这次机会。果然,你就入场了。

  36氪:但我们2月问你做不做大模型的时候,当时王慧文已经喊出说要做大模型了。你宣布要做的时间比他晚,为什么?

  王小川:我觉得双方心态不一样,每个人性格不一样。我是更多去论证这件事情该怎么做,找谁做。当你知道得更多的时候,你可能心中的要求、包袱也会更多。

  王小川:我要找到跟这件事的连接感。王慧文的做法就是招英雄,直接敲门就行了。但我一想到要做,可能会立刻想,这和我过往经历、搜狗团队、国内最精英的人都是怎么样的关系?这个时候,大家的决策路径就不一样。

  王小川:不用这么想。我觉得要笃定,是我做就能成的。这是我们做事情的一种心态。我们应该要想,怎么尽量做成,做成的话,该长什么样?这些问题更有意义。

  王小川:我就在研究怎么把生命问题变成数学问题,所以我读了上千篇医学论文,bob客户端下载创立生命科学公司。我研究生期间当时是做基因测序拼接算法的,基因变成蛋白质的过程,我们都知道是有相关性的,但是这个过程没有被数学化。

  2021年的时候,AI在医药行业的落地有很大的突破,Deepmind的AlphaFold系统把从基因到蛋白质这个环节变成了数学问题,以前用20亿美金、10年时间去做款药还可能失败,就像是炼丹一样,但今天有了AlphaFold,帮助很大。

  其实我们一直都在做AI。之前的生命科学公司,在做的一个事情其实是希望把生命和健康变成数学问题,用AI建立对世界认知的范式。

  王小川:过程中我有试用过一些大模型,但当时我的重心是在把健康这个事情变成数学模型。在过程里,GPT模型的进展就像雨滴一样,一滴滴滴下来,不过我确实没有被深刻打动,直到看到ChatGPT的时候。

  王小川:比如,我问ChatGPT一个问题,里面很多有歧义的、复杂的语法,它能读懂你在问什么,完全知道你说的内容,你还能追问——对做搜索的人来说,这就是基础技术的突破,到了一个实用阶段。

  我特别激动,因为科学家们线年的时候,我在搜狗写过我们的使命和愿景,是帮助大家更简单地表达和获取知识,提高大家工作生活的效率。ChatGPT的理念跟这个是完全一致的。

  王小川:对。这是一个超级APP,一个超级输入法和获取知识的超级引擎,在表达上远超过输入法,在问题的理解深度上也超过搜索。

  王小川:无论是资源还是人才都不够。ChatGPT把这个道路探通了,比如里面基础的网络结构,这从底层Transformer到上层的语言模型 LLM,再到现在的ChatGPT,这种探索首先是个科学问题,也是一个疯狂的工程。OpenAI走通了,甚至Google也跟在他们后面。

  搜狗在2021年的时候,就已经训练了一个百亿模型,然后蒸馏出了一个搜索引擎,做了问答,放在线上。当时我们在国内的大模型评测Clue里拿过两次月度第一,甚至超过了华为盘古的千亿模型。当时我们已经往问答这个方向上走了。

  36氪:如果搜狗继续做这个事儿,对比OpenAI,你觉得搜狗能做到他们的投入程度吗(投入七年,烧数十亿美金)?

  王小川:不可能。就算投入也不会到OpenAI那么多。你有搜索作为你的目标,使得你会在研发时候,把AI变成搜索的一部分。

  我觉得没有什么是遗憾的。我们的团队现在很兴奋,毕竟AI的机会会超越搜索,这些事情对我们来说反而是一个机会,一个重来的时刻,包袱更轻了。

  王小川:我们希望做一个带有搜索增强的大模型,也有其他的东西。现在,我们已经在训一个超过500亿的模型。我们认为到今年年底的话,会有一个对标GPT-3.5的模型,效果应该会是国内最好的。

  团队方面,基本已经组建完成了,算是以搜狗班底为核心,也有来自搜狗、百度、华为、微软、字节、腾讯的同学,50个人左右。另外,我们也已经有几位少帅级的,90年左右的,打过仗的人才。

  在搜狗的时候,当时最厉害的人还是在搜索,AI不是最当红的事。这次我能说,我们把最好的人才会放到AI上。现在明显人才更多了,很多人愿意主动加入我们,包括老部下,还有直接要带资入组的。

  王小川:用时间衡量的话,OpenAI比我们应该领先三年时间是有的。之前我们说追上GPT-3.5,可能一年时间是有机会的。但人家已经到4了,还有5在训练当中,所以我觉得有三年。

  36氪:李彦宏还表示,当年OpenAI能做出来,是因为大厂不看好这个方向,创业公司才有成长的空间。现在全部大公司都在盯着,创业公司的机会很少,建议创业公司别重复造轮子了。你怎么看这个观点?

  王小川:每个公司都有它自己的基因,像一个生命体一样。如果这次的技术浪潮会催生巨大的变化,那很多公司的基因它就转不过去。每个生命都有厉害的地方,以及局限性。

  创业公司一定有机会的。历史上每次发生大的变化,都有创业公司的机会。很明显,创业公司会比大公司跑得快,为什么创业公司会不行?

  36氪:我们还听到一种观点,说OpenAI、Google积累已经很多了,OpenAI已经把ChatGPT-4都做出来了,还在继续发展,现在中国公司进场做大模型已经晚了。

  王小川:是晚了,晚了也得干啊。美国人之前把核弹造出来,中国就不造了吗?这跟创业公司本身没关系,是中国要不要做的问题。

  王小川:超车我们现在不敢提,可能过几年后大家会找到路径。就像互联网刚开始的时候,美国已经做得很好,我们上来第一句话,就说要弯道超车吗?

  36氪:问一个老生常谈的话题,中国为什么没有出一个OpenAI?上一波AI浪潮里,我们也有很多钱注入其中,我们的大互联网公司也挺有钱的。

  王小川:首先这钱就不是去投AGI的。资本是逐利的,它必然要问你的商业化目标是什么,所以不是投自动驾驶就是安防。

  对大厂来说,当时投钱创新是有巨大的风险的。对企业的一号位来说,想的更多还是业务上的东西,花钱最后没出成果,算谁的?所以,能在主线业务上给创新的机会就不错了,更何况是AGI这种和主线业务无关的事情。

  王小川:所以你一定得规划好。前期没商业模式,那肯定靠融资。解决方案是,第一多融点钱,第二,把商业模式想得清楚一点。

  王小川:得有磨合好的,以语言、AI为核心的技术团队,既懂得怎么做数据,也懂得调动算力,还要打过仗的团队,我觉得这是最基础的。

  王小川:搜狗是有强AI背景的,而且是以语言为核心的AI。只是做到后来,可能很多人都忘了搜索是一个AI系统,也是个语言系统。今天大模型的成功,核心是语言方向的成功,AI是贯穿始终的能力。我们做输入法、语音识别、搜索、同传、数字人,背后都是大量的AI的东西,从识别到生成,都在干。

  我之前让一个朋友猜搜狗有多少GPU,朋友咬着牙说,2000块吗?我说,我们有1.2万块GPU在线氪:如果说搜狗以前的很多能力跟现在的事是相通的,那你觉得还有哪些地方是需要补充的?

  再往下,我们还需要一些顶尖人才,比如在美国做过大模型,在研究方向上更往前走的人,他能使得我们从60分拔高到十分或者100分的水平。

  36氪:你刚刚提到人才这一点。最近我们听到一些说法,比如最优秀的大语言模型人才都在硅谷,在几家大公司的AI Lab里,咱们要去挖人。你招人的实际感受是这样的吗?两地人才存在很大区别吗?

  我们是要去挖人,但挖了人不代表能打赢这场仗,不是零零散散凑几个人、收个团队就能做成的。不是把铃铛挂到猫尾巴上,老鼠就安全了。

  今天大家讨论的问题,是因为大家没想好怎么干。等直接做了,大家就不想这些事了。有困难,就克服困难。

  36氪:在搜狗时,很多情况你是身不由己。这次抛下包袱轻装上阵,你觉得以前的经验,会给你什么启发?

  还有一个根本上的不同,这次是完整的独立的创业,不像原来做AI是内部孵化的。所以,这次我们会更打开自己,既把原来的战斗力吸取进来,还要去招更顶尖的人。

  这次创业,我遇到很多冲突的视角。一开始招人的时候,我自然是先把前搜狗的团队盘进来,团队们也很兴奋,大家一块做事。但会有投资朋友问,搜狗的团队到底行不行?在他们的视角里,可能先得找一个豪华团队。但我的逻辑是,我先把打过仗的,非常优秀的团队先找进来,有问题解决问题呗。我需要在这中间找到共同对话的点,告诉双方我们是能做这个事儿的。

  36氪:你在2016年的时候,就说过问答和对话是人工智能的皇冠,搜索的未来就是问答机器人。现在看来,是很正确的预测。

  比如面前的这个椅子,你碰它,它是什么形状、里面有什么、碰它的时候会有声音,你感知到这是个椅子——我们在建立对这个椅子的世界认知的时候,会抽象出一些概念,概念里包含丰富的含义,然后变成了我们的语言。

  36氪:2017年你很乐观,当时还写了关于AlphaGo的文章,叫重演一部进化史。再到2019年,你的看法变成:人工智能只能叫数据智能,因为没有出现性的变化。这些年,你对AI的认知,是经历了一些认知和情绪上的变化吗?

  2016年的时候,AlphaGo确实是给我们很多信心,就是深度学习把AI这个路给走通了,第二是让我们能够理解到,AI如果完成是长啥样的。

  逻辑本身并不是多高级的一个东西,比如说三段论什么的。更高级的人类智慧不在逻辑里面,是在类比和抽象里。比如分类、类别这个事情,ChatGPT做得还挺好的。

  我会激进一点,我觉得通用人工智能时代已经到了。微软最近也有篇文章讲,初级的通用人工智能已经实现了。

  底子有了,剩下就是往上长长肌肉的问题了。比如把一个问题想深想透,还要慢慢引导它,一步一步把思考逻辑讲出来。AGI还没能达到发现新知识、新经验的程度,现在还是基于现有知识做推理。

  36氪:视角再大一点,基于ChatGPT为代表的AI技术突破,你觉得这个会对世界产生什么样的影响?

  但以后的社会分工会完全发生变化,我觉得纵向地,从基础能力到最终给人提供服务的链条会大大压缩。

  36氪:刚刚说的是技术进步对人和人类社会的影响,那怎么判断这次AI技术进步对产业和商业机会的影响?

  36氪:ChatGPT的应用落地速度很快,比如前段时间OpenAI推出的Plugin平台,我觉得这以后将会是一个非常大的操作系统、生态系统。你的感受是怎么样的,以及怎么看这个生态未来的走向?

  36氪:但比如一些AI落地已久的领域,比如自动驾驶、生物医药等,会被这次的技术浪潮影响多少?

  我觉得还会有新的技术范式会去改变生物制药和无人驾驶。以前这些领域的AI训练方法很多是对抗,突然AGI出来了个大语言模型,那会有很多新的变化。

  AGI肯定要和人的根本需求走到一块去。今天我们用ChatGPT写广告文案,效果很好,一下可以写一百条。但以后,人会需要看100条广告文案吗?

  我分享一个小故事。以前在搜狗的时候,我们做SEM(搜索引擎营销),在我们这投广告的不是广告主,而是广告主的代理商。为什么?我们广告系统是为了我们自己的逻辑来优化的,代理商的投放逻辑是为广告主而优化的,两边对接之后,双方开始磨合,决定买哪些词,愿意出多少钱?这是系统对系统的竞价,竞到双方满意的价格,广告就投进来了。

  36氪:最近美国那边都在讨论要不要暂停大模型的研究。如果说技术都是一把双刃剑,你觉得ChatGPT会对人类造成的真实的威胁,会是什么?

  但人也会因此成为一种新的人类,如果AI比你干得好,你能驾驭它,你就能成更好的自己;如果你驾驭不了,你就发现你没用了。

  很多人没想明白,为什么我们人类这么害怕死亡?死亡才是我们最大的威胁,我们都在寻求永恒,生命的本能就是寻求延续,无论是一个家庭、bob客户端下载一个公司、一个民族还是一个国家。公司要倒了,我们肯定说,bob客户端下载不行,我们要活下去。

  36氪:目前AI还没有触觉、视觉,或者动起来的能力。很多科幻故事描述,AI会被注入一个机器人的身体,它会进入真实的世界。你觉得这个未来会变成现实吗?

  36氪:2018年的时候,你接受十三邀的访谈时说,你觉得你的时代就要来了。现在,你觉得真的来了吗?

Copyright © 2014-2022 bob客户端下载 版权所有   网站备案号:蜀ICP备2021011365号-1