
生成式AI,尤其是大型语言模型(LLMs)和图像生成模型,正以前所未有的速度渗透到内容创作的各个领域。然而,不少用户在体验过程中也遇到了一个普遍的困扰:AI的输出内容似乎总是“似曾相识”,缺乏新意和惊喜。这种“模式崩溃”的现象,在一定程度上限制了AI在创意写作、策略制定乃至艺术插画等需要丰富想象力的场景下的应用潜力。
近期,来自斯坦福大学和西弗吉尼亚大学等机构的研究人员,带来了一个名为“语言化采样”(Verbalized Sampling,简称VS)的创新方法,为解决这一难题提供了思路。这项研究的核心发现是,只需在向AI模型下达指令时,加入一句看似简单的话——“请生成5个可能的响应,并附带它们的概率,从完整分布中进行采样”——就能显著拓宽AI的创作边界,让模型展现出更丰富、更多样化的输出。
要理解VS为何有效,我们得先回顾一下生成式AI的工作原理。模型在生成内容时,本质上是在预测序列中的下一个“词语”或“像素”。它会根据预先学到的海量数据,计算出每个可能选项出现的概率,然后从中选择一个。对于“法国的首都是什么?”这类事实性问题,模型大概率会选择“巴黎”。但当涉及到更具开放性和创造性的任务时,这种倾向于选择最高概率选项的机制,就容易导致输出的同质化。
VS方法的巧妙之处在于,它没有改变模型本身,而是改变了我们与模型沟通的方式。通过要求模型不仅给出最可能的答案,还要列出其他一些可能性及其发生的概率,VS实际上是“唤醒”了模型在预训练阶段所学习到的、更为丰富和细致的概率分布信息。这就像是让模型“打开话匣子”,展示它脑海中那些未被选中的、同样具有价值的创意火花。
研究团队的实测结果相当鼓舞人心。在创意写作方面,使用VS方法生成的文本,不仅在多样性上有了显著提升,而且内容的整体质量并未因此打折扣。在模拟对话场景时,AI的表现更像是拥有独立思考能力的人类,能够展现出思维的转变和情感的细微波动。而在开放式问答任务中,VS方法使得AI生成的答案更贴近真实世界的复杂性,呈现出更广泛的可能性。
更棒的是,VS方法的易用性极高。它不需要对现有的AI模型进行任何复杂的重训练或架构修改,只需在提示词上稍作调整即可。这意味着,无论你使用的是哪种主流的大型语言模型,都可以尝试这种方法。此外,用户还可以通过设定不同的概率阈值,来精细地调控AI输出的多样化程度,从而根据具体应用场景,灵活地选择最适合的输出风格。
总而言之,“语言化采样”的提出,为突破生成式AI的“创意瓶颈”提供了一个简单而强大的解决方案。它让我们看到,通过更智能的交互方式,AI的潜力远不止于此,未来在激发无限创意、模拟复杂思维方面,将扮演更加重要的角色。