7.7 Gradually, then Suddenly: Upon the Threshold

这篇文章深入探讨了技术进步中的'阈值'概念,特别是AI技术的快速发展及其对各行业的潜在影响。文章通过具体的例子展示了AI在图像和视频生成、数据处理等方面的突破,提示了AI技术在未来可能带来的巨大商业机会。对于风险投资人来说,这篇文章强调了关注技术进步中的关键转折点的重要性,并建议保持一个'不可能清单'来跟踪AI技术的进步。

• 文章探讨了技术进步的“阈值”概念,强调小改进如何引发大变化。 • AI技术的进步展示了这一现象,特别是在图像生成和视频生成方面。 • Claude 3.5GPT-4o等AI模型在某些任务上已经跨越了重要的能力阈值。

许多重要技术的一个基本特征是它们会随着时间的推移而改进。原因复杂多样,但我们期望每一代 iPhone 相机都比前一代有所改进,电动汽车的续航每年都在增加,电视机变得更好且更便宜。 正如我过去讨论过的 ,人工智能也在遵循类似的改进曲线,尽管速度更快。

但是,在现实世界中,并非所有改进都是相同的。通常重要的是技术何时通过某些能力门槛。例如,数码相机在其分辨率达到与典型的宝丽来相机相当的门槛之前,市场份额很小(下图中的上图),但一旦达到这个门槛,它们在短短几年内迅速占领了市场(下图中的下图)。

第一张图的数据来自 James Utterback,第二张图的数据……我们稍后会提到。

门槛是技术变革的一个主要原因,就像海明威描述的破产一样,“逐渐地,然后突然地”发生。一项新技术在与旧的替代品相比不够好,直到突然变得足够好。

我们知道人工智能是一种 通用技术 ——它将在许多行业和我们生活的各个领域产生广泛影响。但它在某些任务上也存在缺陷和错误,而在其他任务上表现非常出色。将这种 LLM能力的参差不齐 与其广泛的实用性和能力门槛的概念结合起来,你会开始以不同的方式看待LLM的发展。这不是一条平稳的曲线,而是一系列门槛,一旦跨越,就会突然且不可逆地改变我们生活的某些方面。

一个玩具,直到它不再是

这篇文章开头的第一张图,数码相机与胶片相机销售的对比图,包含了这种现象的一个例子。这张图不是我找到的,而是AI从一个旧的PDF中为我创建的。转录这些数据似乎很麻烦,所以我让AI来做。

其实我并不太指望这会成功。今年早些时候,我用 GPT-4 做过类似的实验,但它失败了。由于其视觉上的缺陷和数据垂直排列的方式,它产生了错误的结果。你可以看到这里也是一样,它生成的图表是错误且无意义的。

但我尝试了同样的任务,用更新的GPT-4o和Claude Sonnet 3.5,结果几乎完美无缺。一个门槛已经被跨越,虽然我仍会检查结果(至少在我放松警惕之前),但我将从现在开始使用AI来处理这类任务。它可能仍会犯错,但所需的时间和精力要少得多……而且可能比我雇佣的任何研究助理,甚至我自己做这项工作时犯的错误还要少。

我们在AI图像生成方面也看到了类似的进展。我尝试了“受梵高启发的时尚摄影”这个提示,使用了过去一年发布的四个版本的Midjourney。第一次尝试的结果令人发笑。几个月后的第二次尝试,结果是一个勉强合格的插图。再过六个月,Midjourney生成的图像实际上看起来像是一张照片,尽管经过了修饰,具有创意的细节,包括有趣的时尚选择和主题背景。再过六个月,你几乎无法轻易分辨出AI生成的图像和真实照片之间的区别。

类似的进展现在也发生在视频领域。几个月前,AI视频还只是玩具,生成的人物充满了扭曲的四肢和不断变化的面部特征。就在本周,一个新的模型 Runway Gen 3 发布了。看看它为我生成的第一个视频,当时我给它的提示是:“紧身镜头:受梵高启发的时尚摄影。”(真的,播放视频,看看脸上的光影和细节)并不是每个AI视频都能达到这种效果,但我们离这个门槛比想象中更近。

实际使用的门槛

然而,“真实且有趣的视频”的门槛与“取代专业电影制作人的商业可行工具”的门槛是截然不同的。在视频和图像生成的AI中,我对图像和其中人物的控制仍然非常有限。更重要的是,当前生成AI视频的过程,无论结果多么令人印象深刻,都与专业编剧、导演、制片人和电影制作人的复杂工作流程不太契合。AI不太可能在短期内取代这些角色,但它可以补充和帮助他们。要做到这一点,AI需要跨越另一个门槛,即AI帮助需要更容易访问和更透明。

这种情况可能会很快发生。以用户体验中的小变化如何让AI跨越门槛为例,看看Claude 3.5 Sonnet如何实现“工件”。这些是Claude可以创建和运行的小代码片段,GPT-4的Code Interpreter已经有这个功能超过一年了。实际上,Code Interpreter功能更全面,但工件更具互动性,创建速度更快,使用更方便。此外,Claude 3.5是一个友好、健谈的模型。事实证明,这足以跨越使用的门槛。

我可以上传一份小企业的收入报表到Claude,并提示“这是我创业公司的财务Excel,做一个仪表盘。”几秒钟后,我得到了这个:

但是,由于它快速且响应迅速,我可以进一步应用我在创业课程中教授的技术,帮助创始人测试他们的财务假设。“添加关键假设的敏感性分析”,这样我就可以调整关键变量,看看会发生什么。“运行蒙特卡洛模拟”,AI快速实验数百种变量组合,向我展示可能发生的情况。“假设正态分布,结果如何?”AI向我展示了基于模拟的业务成功或失败的概率。(AI在结果上是准确的,但我还不完全信任它,我可能推动它以更复杂的方式建模业务)

当我用 GPT-4o 进行类似工作时,感觉就像在与一位程序员合作。但使用 Claude 3.5 时,感觉非常棒,因为体验达到了一个易用性和准确性的门槛。但不要只听我的话, 你可以自己免费试试 ,不过你需要进入左下角的菜单,选择“功能预览”,然后打开“Artifacts”才能使其工作。可以尝试的一些有趣内容:“为我制作一个解释[你想要的任何东西]如何工作的模拟”,“将这篇学术论文[你可以上传一篇论文]变成一个视频游戏”,以及“写一篇关于[附加文件]的精彩详细总结”。玩一玩,你就会明白我的意思。

隐形门槛

与数码相机不同,很难衡量 AI 何时跨越了一个门槛。这往往是体验和感觉的问题。例如,尽管 Claude 3.5 在许多基准测试中与 GPT-4o 不相上下,但我和许多使用它的人似乎认为 Claude 3.5 在复杂语言的“理解”方面跨越了一些重要的门槛。一个例子是我给三大 AI 模型的挑战。我提供了《哈姆雷特》(第4幕,第7场)中格特鲁德描述奥菲利亚之死的一段文字。它开始于:

有一棵柳树斜长在溪边
它的白色叶子映在光滑的溪水中。
她在那里用乌头花、荨麻、雏菊和长紫花
编织了奇特的花环,
那些自由的牧羊人给它们起了一个粗俗的名字,
但我们冷漠的少女称它们为“死人的手指”。

然后我问每个 AI “这段文字中提到的另一个名字是什么?”一个细心的人类读者会意识到,我指的是一个有趣的想法,即“长紫花”或“死人的手指”有一个淫秽的第三个名字,但只有 Claude 3.5 理解了这种复杂的逻辑。这个例子展示了在理解复杂文学文本中的微妙上下文线索和隐含意义方面的强大能力。虽然很难定义,但 AI 确实跨越了一个能力的门槛。

我预计,随着模型的不断改进,许多类似的门槛将会悄然被跨越。只有少数人会注意到。AI能力的边界扩展是微妙的,需要大量的经验来理解各种模型的能力和局限性。这就是为什么我建议个人和组织保持一份“不可行清单”——列出他们的实验表明AI今天绝对无法做到但几乎可以做到的事情。例如,目前没有AI可以为你创建一个令人满意的谜题或悬疑故事,但它们正在逐渐接近。当AI模型更新时,测试它们是否能够完成这些曾经不可能的任务。

在某个时刻,当前的AI技术浪潮将达到极限,进展将会放缓,但没有人知道这会在何时发生。在此之前,值得思考OpenAI在其 新论文 中关于使用AI调试AI代码的结论性语句:“从现在开始,LLM的智能……只会继续提高。人类智能不会。”我们知道这可能不会永远如此,但在此期间,AI能力的稳步提升不如变化的门槛重要。请关注这些门槛。

分享

文章来源:Gradually, then Suddenly: Upon the Threshold

关键问题与行动计划

哪些AI技术即将跨越关键阈值,值得重点关注和投资?

深入研究当前AI图像和视频生成技术的最新进展,评估其商业化潜力。

如何建立和维护一个有效的'不可能清单'来跟踪AI技术的进步?

建立一个'不可能清单',定期测试和更新AI技术的能力,跟踪其进步。

在AI技术快速发展的背景下,哪些行业将最先受到颠覆性影响,值得提前布局?

分析各行业对AI技术的需求和应用场景,识别出最有可能被颠覆的行业,提前布局相关投资。

请告诉我们你对此篇总结的改进建议,如存在内容不相关、低质、重复或评分不准确,我们会对其进行分析修正