Windsurf CEO采访:AI coding的未来
看了一遍5月2号YC对Windsurf CEO的采访,深有感触,记一下笔记。
还是强烈推荐看一下原本50分钟的采访,B站上就有中字的视频。
从GPU虚拟化转型AI coding
Windsurf背后的公司其实是21年成立的,最开始是做GPU虚拟化的,手上有1w张GPU,一年几百万美元营收,而且融资了2800W美元。22年的时候,创始人看到了Transformer会吞噬一切,未来定制化GPU推理运行时可能变得没市场。他们团队当时是copilot的用户,觉得这是一个很好的方向,然后在48小时内就开始觉得要开始做AI coding方向了。
这里创始人提到了创业需要同时具备2种品质:
- 非理性的乐观主义:因为如果总是怀疑这怀疑那,最终肯定是一事无成的。
- 现实主义:但是如果现实发生了变化,那你的想法也要跟着变化。
这2种品质中的任何一点做到其实都不容易,但是如果要取得成功,需要同时具备这2种品质,而这2种品质是矛盾的。非理性的乐观主义会让你获得执行力,但是反过来可能会让你陷入盲目自大的情况,而忽略了现实的变化。而过于关注现实的人,又缺乏了前瞻性和对未来的预判。
评论:这个转型我觉得好牛,因为他们的营收完全可以继续沿着GPU虚拟化这个方向去做,结果他们完全抛弃了过去的思路,开始转型搞新的方向。而且当时copilot手握github的代码, 背后还有microsoft和openai的加持,在当时看来简直就是无敌的存在,这个没有非理性的乐观主义还真的做不到。这里顺便提一嘴cursor,cursor一开始就做AI IDE也是一种极强的乐观主义,因为做IDE的难度可比做IDE插件高太多了。
8个人2个月上线第一版
最开始Windsurf做的是IDE插件Codeium。Codeium的第一个版本是基于开源模型+vscode插件来做的,8个人2个月就上线了第一版,之后采用免费使用的策略进行推广(copilot是10刀/月)。而之所以他们能免费提供高质量补全服务,是因为前面提到他们做GPU虚拟化的时候手上有1W张GPU。
在这之后,通过免费吸引个人用户收集数据,然后给B端用户进行定制,几个月内就收获了一些大单。在一年内,业务收入就超过了千万。在23年初的时候,补全效果就已经比copilot更好了。
评论:这里我觉得更牛,因为他们开始的团队是做推理Infra的,转型到做AI coding,居然只花了2个月就出来了第一版,只能说团队成员是真的优秀。而且刚好他们手上有1w张GPU。这一点跟deepseek团队转型搞大模型有异曲同工之妙。
从codeium转型到windsurf
在24年初,他们团队就相信agent会产生更大的价值。他们做了很多工作,但是串不起来,直到claude sonnet 3.5的出现,他们发现ai coding agent可以运行良好了。接着,他们又完成了一次转型,用了3个月时间开发出了windsurf,这时候工程团队大约25人(这个人效太牛了)。这次的转型虽然没有之前从GPU虚拟化转到AI coding赛道上来那么彻底,但也是all in AI IDE,所有人停下手中工作开始做windsurf.
这里主持人问了如果看待跟Cursor的竞争?创始人说的是他们一直都面临很大的竞争,最开始是copilot,然后是Devin,接着是cursor,但只要有一个长期的战略,然后在细节上灵活处理的同时,始终朝着这个长期战略的方向执行,就有获胜的机会。
所有的insight都会贬值,你需要不断提升自我
这里就提到了一个很有意思的点,23年的insight放到24年就已经过时了,就像技术一样,你只能通过一种复合的技术优势来保持领先。这里他举了一个NVIDIA的例子,如果NVIDIA在接下来的2年内没有创新,AMD就会赶上。同样的,你只有拥有insight,然后持续从市场中学习试错,这是唯一可以持久的事情。
接着又提到了RAG,通常的做法是直接用向量检索的方式。Windsurf并没有直接用向量数据库检索的方式,而是综合了关键字搜索、RAG、AST解析等多种方式。因为从用户的需求和实际场景出发,综合多种技术才是最好的选择。
Eval非常重要
这里提到你不能开发完软件,然后让它运行,你需要让这个产品变得更好。你需要一个评估标准,评估你做的工作是否有效,加的组件是否能够让指标爬坡。Windsurf公司不追求复杂性,而是追求有效的方式,为什么Windsurf会变得复杂?因为这样做可以让评估指标提升。有了指标后,才可以爬山,不然就是在盲目射击。
这里也提了一嘴windsurf是如何做eval的,将github上带了测试代码的提交进行处理,比如只保留commit信息+unit test,看AI能否检索出需要更改的部分,或者让AI写出代码看能否通过测试,这样进行挖空处理就可以计算出各种accuracy。
评论:这一段我太赞成了,深有感触。因为AI软件跟原来软件不一样的地方,就在于产品形态基本不会太复杂,不会有很多页面和按钮,做一个出来很简单,大部份时候就一个聊天框。但是做完这个聊天框以后你会发现可能用不了,不能做完这个聊天框你的工作就结束了,功力体现在效果上。算法改进、工程优化必须建立在评估指标的基础上,不然你都不知道下一步该往哪里走。个人感觉,AI软件的工程开发有点偏研究的意思,因为做研究肯定是要指标的,但是做AI工程也需要有指标,哪怕就是调prompt,没有指标就没办法证明哪个prompt更好。
AI coding工具的演进会带来什么影响?
随着AI coding工具的效率越来越高,软件工程可能会朝着研究文化演进,软件工程师不需要花时间在编写重复性的样板代码了,而是去不断的测试假设、建立评估、与用户沟通,去做这些使产品变得更好的事情。创业公司不应该雇佣代码写得好看的人,因为即使代码丑陋,初创公司也能成功,初创公司失败的原因是没有打造出对用户来说有差异化优势的产品。
Windsurf如何做招聘?
面试允许使用AI工具,看看有没有使用AI工具的意愿,排斥AI工具的不适合这个团队。
因为AI在做题上基本无敌,所以面试时更关注在约束条件下如何进行思考,有没有求知欲,思考有没有深度。
如果我们能够即时构建软件会怎样?
这里主持人提到,如果AI coding能力足够强,那么是不是可以让AI根据需求即时构建一个软件,这会改变软件开发的本质吗?创始人认为未来每个人都可以是builder,完全可以根据需求来即时构建。
评论:这个问题其实很有意思。因为我们使用软件是为了完成某个需求,软件只是一个工具,一种媒介,如果AI coding能力足够强,那么不需要提前编写软件,有什么需求让AI实时生成软件来完成就好了。结合现在vibe coding的概念被提出,以及很多没有编程经验的人也能构建软件来满足日常需求,这确实会是一种趋势。当然,复杂的软件还是会由专业的程序员来完成,但是简单的需求用户自己就可以完成了。程序员的时间是很贵的,如果ROI太低,原本是不值得做一个软件去解决的,尽管这确实是一个需求和痛点。当编写软件的成本足够低后,这些需求就能够得到满足了。现在独立开发APP越来越多也反映了这个趋势。
关于GPT套壳?底层模型升级了会不会吞噬应用层?
公司的目标是动态的,底层模型升级了那么应用层也要跟着升级。应用层的机会在底层模型的能力和100%的正确的答案中间的gap,并且只要human-in-loop,这种gap就永远都会存在。假如底层模型节省了90%的时间,那么只需要再提升2%,那么获得~20%
的增长。这也是很有价值的,因为此时baseline已经变成了90%,那么提升到92%也是~20%
的增长。
最后的话
你改变主意的速度比你预想的要快得多是合理的。你很容易地一次又一次地爱上自己的想法,你确实需要这样做,否则不会去做任何事情。但需要尽快转变,并将转变视为一种荣誉的象征。大多数人没有勇气改变自己对事物的看法,他们宁愿在告诉所有人他们要做的事情时失败,也不愿改变主意,迈出大胆的一步并取得成功。
The biggest thing I would say is change your mind much faster than you believe is reasonable. It’s very easy to kind of fall in love with your ideas over and over again and you do need to otherwise you won’t really do anything, but pivot as quickly as possible and treat pivots as a badge of honor. Most people don’t have the courage to change their mind on things and they would rather kind of fail doing the thing that they told everyone they were doing than change their mind take a bold step and succeed.
最后这几句话说得太好了,既要自信乐观,又要拥抱现实,共勉~