大模型驱动行业创新 媒体机构探索AI数据要素开发

发布时间:2024-11-05 20:18:11 来源: sp20241105

“数聚未来——凤凰大模型数据研讨沙龙”现场。受访方供图

“数聚未来——凤凰大模型数据研讨沙龙”现场。受访方供图

人民网北京11月14日电 (记者许维娜)近年来,人工智能技术的应用不断改变着传统新闻生产流程,重塑着整个新闻业态。不少深耕内容科技领域从业者,正寻求AI、大数据等技术与媒体等行业的深度融合。

日前,“数聚未来 —— 凤凰大模型数据研讨沙龙”在京举办,与会嘉宾们共同探讨高质量数据构建与基于数据驱动的大模型训练优化。

凤凰卫视执行副总裁兼运营总裁李奇在致辞中表示,数据仍然是目前人工智能发展的短板之一。数据就像是人工智能时代的石油资源,它的开发和应用都将是一个系统工程,需要产业界无数企业共同参与。期望发挥凤凰的媒体平台优势,为产业界建立一个共建共享的数据平台,共同推进人工智能的快速发展。

微博COO、新浪移动CEO王巍在主旨演讲《数据赋能:微博探索AIGC多场景应用》中提出,围绕大模型,目前已经形成由基础设施层、模型层、应用层共同构成的AIGC(生成式AI)生态体系。对于媒体而言,AIGC将带来内容生产方式的变革,AIGC时代的内容质量、效率及产量都将迎来高速发展。在未来,AI将创造出一种新型的“人机共存消费模式”。

“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据资源丰富,但是由于数据挖掘不足、数据尚无法在市场上自由流通等因素,优质的中文数据集依然比较稀缺,成为阻碍大模型研发的重要因素。

“在这里,我们也呼吁更多的媒体机构加入到中文数据集的建设中。这将是一项非常重要的基础工作,因为它为AI技术提供了丰富、多样的数据源,有助于提升AI模型对中华文化的理解。”王巍表示,中文数据集的建设不仅能够满足媒体行业的需求,还将推动AI技术在华语地区的更广泛应用和发展。这一工作具有很高的价值,将为媒体行业和AI行业带来更多的创新和合作机会。

王巍还介绍,目前,AIGC在多个领域的创新成果逐渐显现,媒体作为最适用AIGC相关技术和产品的产业之一,在这一变革中面临全新的挑战和机遇。

华为云 EI 产品部部长尤鹏带来《盘古大模型的数据之道》的主旨演讲。尤鹏表示,华为希望和凤凰卫视一起共建数据黑土地,共同探索产业界自下而上的数据合作路径和商业模式,共同构建大模型的“数据-算力-商业”飞轮,推动数据产业发展。

期间,凤凰卫视推出 “凤凰智媒 AI 数据业务”,并发布 “中文访谈对话数据集” 和 “正向价值对齐数据集”。

凤凰卫视融媒体研发副总经理冯伟表示,高质量的数据语料库是 AI 时代承载中华文化的新载体,凤凰数据的核心目标是为 AI 时代的中华文化传播奠定坚实基础,让 AI 与中华文化认知对齐更简单。

据悉,2024 年,凤凰数据计划分三批发布更多高质量数据集,并正式上线 AI 训练平台。同时,凤凰数据还将举行 “Link + 科技峰会” 和 “AI 数据挑战赛” 等系列活动,共同推进 AI 与华语文化的认知进程。

(责编:乔业琼、吕骞)