生成式AI进入应用爆发期从“玩具”到“工具”尚需时日_技术

生成式AI进入应用爆发期从“玩具”到“工具”尚需时日

人民邮电报
作者：
2023年2月9日 13:50

工联网消息(IItime) 大规模预训练语言模型ChatGPT 一经发布便成为新晋网红，它能够以对话的方式与使用者进行交互，高质量的内容回复、上瘾的交互体验，不仅吸引全网用户探索ChatGPT的应用场景，也让AI技术发展以及在各行业领域的创新应用备受关注。

多样化产品竞相涌现

谈到AI领域的未来发展，就不得不提生成式人工智能（以下简称“生成式AI”）。简单来说，生成式AI是利用现有文本、音频或图像创建新内容的技术。自2021年起，生成式AI连续两年入选Gartner《Hype Cycle for Artificial Intelligence》，被认为是未来重要的AI技术趋势。2022年，AI画作《太空歌剧院》在美国科罗拉多州举办的艺术博览会上摘得金奖；近日发布的AI模型MusicLM可以根据文本、图像内容生成音乐，且曲风多变。这意味着，AI的触角已深入艺术创作等创意型脑力工作领域。

刚刚过去的2022年，扩散模型Diffusion和大规模预训练语言模型ChatGPT引领研究热潮，其突破性发展对于生成式AI具有重要意义。在人工智能顶级会议ICLR 2023中，Diffusion Model”作为论文题目关键词的频率排名从去年第159名上升到第14名。Stable Diffusion作为一款高性能深度学习模型，能够根据文字描述生成精美图像，将AI图像生成的效率与精度提升到前所未有的量级，在基础的终端设备上，只需输入关键词，就能生成高质量的AI图像；基于GPT-3.5的对话式AI ChatGPT不仅能够“理解”对话者的语义进行连续对话，还能写作甚至编程，生成内容的能力空前提高。生成式AI将为内容领域的生产方式带来变革，也让内容生产变得更容易、更个性。据Gartner测算，预计2025年超过10%的数据由生成式AI创造。

生成式AI产品竞相涌现、形态多样。目前生成式AI产品形态包含插件、API网页交互、客户端等。其中，插件形式通过IDE（集成开发环境）运行代码，不需要引入新的应用程序。API网页交互在云端即可获得生成内容，如用户可在百度的“文心ERNIE 3.0”产品网页中输入提示词生成内容。国内生成式AI产品以语言生成类和视觉生成类为主。华为云推出数字内容生产线MetaStudio，可用于虚拟直播、虚拟视频内容制作；百度发布的AI艺术和创意辅助平台“文心一格”，能够根据用户提供的文字描述和创作风格生成相应画作。在国外，生成式AI产品正在迅速获取大量用户。根据知名创业组织Antler的统计，截至2022年年底，海外生成式AI产品数量达到190余个，包括视频、音频、游戏、数据、搜索等多种类型应用。同时，2022年年底图片生成应用Midjourney官方Discord中的关注人数超过百万，ChatGPT上线后一周内用户数量已近百万。

内容监管难度将增加

社交论坛Reddit用户晒出了自己与ChatGPT的交流：“如何用JavaScript方法在调制控制台中打印一只大狗？”ChatGPT则马上“写”出了一段代码，用各种字符拼出狗的形状。看似简单的问答，实则展现出生成式AI的强大能力。对于用户而言，交互方式与平时的对话交流并没有太大区别，输入文字内容即可。由于ChatGPT解决问题的能力过于优秀，很多用户表示，它完全可以取代搜索引擎，甚至代替学校助教来回答专业领域的学术问题等。

发展总是与挑战并存，生成式AI的发展也面临诸多挑战。文本生成类应用在生成可控性、准确性等方面仍表现不足。比如AI“写”论文时，可能会引用不合适的例子或者错误的数据；“编”代码时，可能会生成看起来没问题但是会报错的代码。据了解，由于ChatGPT在解决复杂程序问题时表现不太理想，技术交流论坛Stack Overflow曾临时禁止ChatGPT回答编程问题。

图片生成类应用则面临版权争议、创作质量不高等问题。AI“创作”时会借鉴大量绘画作品，根据用户给定的关键词和创作风格“依葫芦画瓢”，生成内容与原作相似度较高，版权争议较大。据了解，综合CG视觉艺术作品展示平台ArtStation已有艺术家呼吁“NO TO AI GENERATED IMAGES（拒绝AI绘画）”，一时间网站首页大部分被此图片占领。此外，ArtStation网站新增了过滤功能，用于隐藏搜索结果中的AI作品。

随着AI技术不断成熟、深度学习算法持续演进，生成式AI的创作水平逐步提升，有些内容已经到了可以“以假乱真”的地步。除版权问题需要明确外，随意使用“换脸”“变声”等功能有可能加速虚假信息的传播，从而增加内容监管的难度。

对于代码、绘画、音乐等作品，如何能判别作者是人类还是AI模型？调查发现，89%的美国大学生已经在用ChatGPT写作业了，部分欧美学校开始从课程设计上着手打击AI生成的作业，比如增加口试、团队合作等课程评估方式的占比。近日，人工智能研究初创公司OpenAI，也就是ChatGPT的所有者，推出了一款名为Text Classifier的工具，旨在弄清文本内容的作者是人类还是AI。有趣的是，这款文本分类器与ChatGPT都基于GPT模型，颇有以子之矛攻子之盾的意思。该公司称其仍然在研发优化中，仅可用于长度大于1000个字符的英语文本内容，且现阶段使用效果并不理想。

* * *

如今，生成式AI已经逐渐渗透到专属于人类原创的领域，画作、论文、音乐乃至代码都可能出自AI之手。生成式AI正在进入应用爆发期，但是这种增长可以持续吗？用户的新鲜感如何维系？

从新颖的“玩具”到解决问题的“工具”，生成式AI在模型训练成本、构建独家差异化优势、用户获取策略等方面仍需努力，逐步建立可持续的生成式AI商业实践模式，帮助人们更好、更快、更低成本地创作，以多元应用不断创新AI应用范式，并将实践成果逐步延伸至智慧教育、智能制造、医疗等领域，真正成为人们生产生活的得力助手。

编辑：盖贝贝

分享到：