李大海 知乎合伙人兼CTO

2006年,毕业于北京大学数学科学学院数学系,先后供职于谷歌、云云网和豌豆荚。加盟知乎后,李大海先后负责过广告技术团队、数据、算法和整体社区业务,目前统筹负责知乎大数据团队、内容流通和AI新业务的拓展。

— 文 |babayage

编辑 | 笑笑

2006-2010 告别数学加盟谷歌

成长之初技术视野>技术细节

2006年,即将毕业的北大数学系硕士李大海,陷入了一场决定人生方向的长考:坚守在数学界做一名数学工作者,亦或脱离数学领域彻底转做其他的职业。

李大海对数学的情感堪称热爱,但学习是一回事,以其为事业就要面临很多现实问题:在数学界,解决一个课题短则七八年、长则数十年甚至穷尽一生,他深知自己并不能稳坐研究室、深度钻研单一课题的性格;性格之外,“我对自己的能力也没那么大信心,在数学领域我可能只能成为一名平庸的数学工作者”。

“可如果不是数学,我还有什么其他选择?”

从初中开始,计算机一直是李大海的兴趣,也作为早期发起人成立了北大linux俱乐部。恰巧,2006年,Google 迈出了进入中国市场的第一步,李开复开始在中国内地进行人才本地化的项目,宣讲于全国各大名校,打算招收 50 个关门弟子。

机缘巧合之下,李大海加盟谷歌。

科创人:在谷歌的四年时间里,您最大的收获是什么?

李大海: 方方面面都学到了太多东西,谷歌团队个个都是牛人。 当年有一本书我的印象很深,王咏刚老师写的《道法自然》,王老师用特别活泼的语言将模式设计思路介绍得清清楚楚,没想到从实习期开始我就在王老师的团队里;还有一次我负责接待客人去长城游玩,接待的对象居然是Python发明者Guido van Rossum。在这样的环境下,需要做的就是完全打开自己,尽可能吸收一切。

在谷歌的四年里,与其说自己的技术实力增长了多少,更大的收获是打开了技术视野、强化了技术思维。

2010-2014 云云网,初次创业

不平衡的团队

李大海有一位同学,听闻李大海在谷歌任职,便屡次以美食利诱,一边吃饭一边灌输关于创业的理念与愿景。三来五往,本没有创业想法的李大海,倒也心思活络了起来。

压垮骆驼的不是稻草,而是一整栋坍塌的摩天大楼——2010年,谷歌退出中国,李大海深思熟虑后决定离开,“还是希望能做服务中国用户的事情”。

论学习环境,谷歌自是最佳选择;一旦决定离开,就只有创业能让李大海燃起“值得一做”的心底热烈。只不过,他并没有与N顾茅庐的同窗好友合作——不知此君是否心疼饭钱——而是加入了前谷歌中国工程研究院副院长刘骏创建的云云网。

云云网甫一创建,便因其谷歌全明星技术团队而备受瞩目,在圈内掀起了不少的波澜。云云网的业务方向在当年并无先例,没有“新浪—雅虎”“百度—谷歌”“人人网—facebook”这类直观参照,连创始人刘骏自己也直言“云云网是个全新的东西,跟目前人们已知的东西完全不同,没办法类比”——直到多年之后,它才被抽象描述为“ 一个社交化的搜索引擎 ”。

在云云网,李大海负责实时搜索引擎、基础库以及一部分代码框架的开发工作。

科创人:从学习状态到创业状态,在两种差别巨大的模式中进行硬切换,是怎样一种体验?

李大海: 压力陡增,但影响力也大了,公司的方方面面都与你有关,感觉很有挑战。我可能还是挺适合创业的,有一种天高任鸟飞的自在感。

有个有意思的事,可能是因为团队里很多谷歌出来的人,很多在谷歌的工作习惯被延续下来了,所以适应起来也没那么难。 谷歌出来的人会有一些“臭毛病”,在谷歌见过很多好用的工具,出来之后发现没有趁手的工具特别别扭,就会说“我们先做工具吧”。我也做了一些这样事,比如类似于 Google Blaze 的 C++ Build System等等。

科创人:最近有首歌《孤勇者》特别火,里面有句歌词叫“和我那么像,缺口都一样”,一个以工程师为绝对主角的团队,是否大家的短板、缺陷也比较类似?

李大海: 绝对如此。 复盘第一次创业失败,团队不平衡是一个重要原因,我们也有产品经理、很专业的运营人员,但在团队内这些岗位的话语权不够强,作为一个技术为主的公司,在做产品的时候没有太抓住用户的痛点,导致一个看上去不错的逻辑却很难跑通。 我们当年要做的社会化搜索,以买车为例,就是“我和你是朋友——你搜索到的内容会显示我的评价——直接促进购买决策甚至购买行为”。最终我们发现,这个逻辑需要一定的信息密度作为支撑,也就是它可能要依赖一套增加信息密度的产品,稍微一想就知道这一定是款大规模的产品,我们没办法直接去做一款出来。

也是因为这次经历,我对于信息密度、信息内容的丰富程度有了很深的理解。

2014 加盟豌豆荚

正确的逻辑,错误的时机

“现在是移动搜索的年代,这事儿有时间窗口,如果你还想做搜索的话,来我们这吧。”豌豆荚创始人“崔阿姨”崔瑾的一番话打动了李大海,他抱着未酬的搜索壮志加盟豌豆荚。

将时针扳回2014年,豌豆荚这一头部应用商店与搜索技术的结合有着近乎无限的想象空间:用户只需在应用商店内输入自己想查询的饭店,商店就能直接调出点评类APP并跳转到该饭店的页面;用户只要搜索订票,商店就能调出订票APP直接呈现订票页面……

但真正上了手,问题接踵而来: 首先技术难度门槛颇高,“PC时代互联网基于HTML,爬虫可以高效地处理所有页面,但移动时代APP端都是结构化的信息,想用高效打通并调用成本非常高,进而影响搜索引擎构建的效率”;如果说技术问题尚属方法论层,真正的毁灭性打击,来自移动互联网生态的整体变革,手机厂商迅速崛起、形成头部效应,各品牌手机自制应用商店并预先内置应用的做法,不仅令APP生态同样形成了头部效应,更是近乎碾压的摧毁了第三方应用商店的生存土壤。

直到若干年后,微信小程序以另一种方法论跑通了豌豆荚们当年预想的商业模式,而此时的李大海,也已经寻找到了值得倾注全部心力的梦想。

2014-至今 知乎

价值观契合的内容宝矿

写到这,基本可以归纳总结出李大海的职场迁移模式:从技术到产品,或者说,从醉心技术细节到更全盘的产业洞察。2015年,李大海受周源的邀请加入知乎,之所以加盟知乎,有两个重要的原因:第一,在李大海看来, 知乎拥有他之前几次创业项目稀缺的核心资源——兼具价值与数量的有效信息 ,也就是优质的问题与回答,“经过前两次教训,我认识到内容的价值,而这些内容与技术结合能引爆出更大的能量,而当时知乎在技术层面上还没有开始由机器学习去推荐,潜力很大”;第二,知乎的理念非常契合他的价值观: 高价值的知识,应当以生动的故事为载体,而非枯燥的说教 ,“学数学的时候我感到很痛苦,那是一套公理体系,公理一定理二、三推出猜想四,这些理论背后的故事、如何产生、当时为了解决什么问题,全都没在课本上体现,恰恰这些部分可以让学习者能够更高效的消化知识。”

“帮助更多人用更简单的方式更全面地了解这个世界,这件事值得一直做下去。”如果说之前的创业目标只是做一款牛X的产品、一份名利双收的事业,在知乎,李大海真正体验到了一种理想主义特有的铿锵,那是每一步前行都在改变世界的烙印余响。

最初,李大海只负责算法与大数据,但不久之后他便接管了首页,首页推荐系统是知乎最重要的一个产品,但当时现状不理想,不仅一个请求得等上两秒,甚至首页的推送逻辑是每个用户有一个mailbox,知乎放200条信息进去,“刷完就刷完了,一天就这200条”。

李大海迅速摒弃了这种“古老的算法”,将知乎首页切成推荐系统,使用机器学习技术,迅速改善了用户体验,用户时长、次留、DAU等关键指标均大幅提升。

保持外部视角

避免信息茧房

科创人:您可能是最了解知乎底层的人,从逻辑原理到技术细节都很清楚,在内部信息如此庞杂的影响下,您如何保持“用户视角”“外部视角”?

李大海: 好问题。首先,技术团队每个人都必须是社区的玩家,我要求大家每天有一定的活跃时长, 自己的产品自己首先要体验,自己玩起来才能知道用户的痛点是什么,为什么痛,否则就无法共情 ;其次,我们成立了用户体验中心,用多种方法、多种渠道不断倾听用户的反馈声音,方法包括线下访谈、采集有效的用户反馈、对用户行为痕迹进行数据分析等等—— 知乎非常重视数据科学,非常强调实验的科学性。

科创人:推荐算法导致的信息茧房,以及以人为信息节点而导致头部效应,是内容型社区势必面临的挑战,知乎如何避免这一现象的发生?

李大海: 知乎一直致力于完善、优化内容分层,对每一个领域的内容进行评价,除了推荐给用户他感兴趣的领域内的优质内容,也会想跨领域的优质内容推荐给他。 除了关注推荐系统的精准度,我们也会关注它的惊喜度,让用户看到的内容能够不断开拓他的视野,避免信息茧房。

而对于创作者的头部效应,就要提到知乎的愿景:让每个人都能分享自己的知识、见解,并找到自己需要的解答。在这个场景下显然有一个客观事实: 你需要的回答很可能在一个你完全想象不到的人身上,他可能来自一位KOL,也可能来自一位新注册用户,因此知乎的产品逻辑必须聚焦于优质内容。

当然,知乎也一定能够让持续输出优质内容的KOL获得应得的影响力,包括商业回报。说到底,内容是核心价值。

优质内容是商业化的土壤

最大挑战:内容社区的语义识别

科创人:优质内容与商业内容对于知乎而言各有其价值,作为知乎重度用户,感觉知乎能够把商业信息控制在一个让人舒适的区间内,知乎对商业性内容与优质内容的平衡感,基于哪些原则和理念?

李大海: 商业化变现,并不一定影响内容的优质、专业和中立,这两者并没有天生矛盾的关系,而是要看是以怎样的方式做商业化。过去几年,知乎在商业化层面进行了很多尝试和探索,从成绩上看,知乎已经形成了相对稳定的商业模式和多元化的收入来源。但是这些商业化探索的大前提,依然是保持社区和内容的高质量生产和运转。 知乎始终都坚持不以低质内容换流量,不以牺牲社区氛围换收入,不以蹭热点、博眼球而破坏网络生态 。直到现在还依然是这样。当赚取收入与我们的基本价值观相冲撞的时候,我们选择放弃收入,捍卫价值观。合理收益推动内容创作,是商业化鼓励了专业、中立的优质内容的生产,保持了知乎专业的特性,而不是改变、动摇。

科创人:在知乎,您遇到的最大难题、最大挑战是哪一次?能否相对详细的描述一下具体事件、解题思路及解决方法?

李大海: 知乎是一个内容社区,如何通过技术手段更好的驱动内容的生产和流通,对我们意义重大。我们一直在尝试拓宽 AI 算法在内容社区的应用边界。到目前为止,也有了不少应用成果。知乎 AI 算法应用也已经贯穿了从内容生产、消费以及社区治理的多个场景。

这其中技术挑战有很多, 最大的挑战,我认为是对语义的精确识别,比如说“瓦力”对阴阳怪气内容的识别,核心难点在于网络语言的复杂性 。例如经典的“呵呵”,由于双方不同关系、说话的不同场景和时间都会带来迥然不同的表意。即便是人工判定都存在标准化难度,算法模型的训练挑战就更为艰辛。 知乎基于对于用户切实体验的累积观察,与算法团队一起,从情感倾向性、亲密关系、文本特征三方面入手,建立了内容情感模型、用户亲密度模型和文本识别模型等,并通过训练不断迭代完善。 三大模型的结合,不仅摆脱单一算法模型的局限性,也让“瓦力”的阴阳怪气识别准确率超过了大多数人工判断。

技术团队管理心得

绩效,选材

科创人:作为知乎800多人技术团队的管理者,能否分享下您的管理心得,比如如何保持与战略同频,如何选拔人才?

李大海: 我的管理框架是点线面, 点是关键岗位 ,需要什么技能、满足什么要求必须准确、得力; 线,是指要将大团队里最重要的事提炼出来 ,这件事可能需要很多团队配合才能做好,这些团队如何分解目标、如何合作分工、如何设置流程,需要深度考虑; 面,就是制度、规范、文化 ,尽可能在方方面面影响团队的工程师,提升凝聚力。

知乎的研发团队非常注重对齐业务,一切以实现业务目标、支撑业务价值为目的,因此 我们将业务研发团队的绩效考核权交给了业务团队,确保研发团队给予业务最大的支持力度。

至于选材,其实没有完美的人,人一旦过了30岁,内心形成了理念,想改变Ta非常难。但另一方面,人都有非常大的灵活性和弹性,所以 一定要用人以长,把他的长处激发出来,让他内心真的愿意去做这件事。

科创人:您的个人爱好,未来个人的人生愿景?

李大海: 我平时喜欢跟朋友一起踢踢足球,打打德扑。未来的人生愿景和知乎的业务有较高程度的契合,长远希望通过内容服务、知识服务、趣味教育等帮助到更多的人,能和同事们带领知乎创造更多价值,不管是企业管理还是技术创新,能解决更多问题,进入一个更崭新的局面。

推荐内容