由人民网主办的“智融未来——2023人工智能成果展示会”近日在武汉精彩演绎。展示会上,来自传播内容认知全国重点实验室的相关负责人介绍了生成式人工智能合规性评估体系和语料库的建设情况。
目前,主流价值语料库的建设取得了阶段性进展,已完成3000多万篇基础语料、5万多道问答语料的建设工作。相关工作成果助推了国产人工智能大模型的安全、规范和可持续发展,为生成式人工智能领域提供了更多的规范和参考。
为何要群力群策建设这样一个主流价值语料库?人民日报社传播内容认知全国重点实验室首席科学家张勇东在接受人民网采访时表示,在人工智能时代,媒体的重要职责之一就是保证意识形态的安全。当前,人工智能大模型已经成为一种生成式信息传播工具,因此对于大模型价值观的训练是必要的。“训练人工智能大模型的过程就像培养一个小孩,你从小怎样培养他,在什么环境下去培养他,他将来就成为什么样的人。”主流媒体建立符合中国人自己价值观的语料库,就是对其“成长环境”的一种塑造。
当前,生成式人工智能技术(AIGC)发展迅猛,不仅能够应用于文字,更是在视频、音频等多领域实现突破。那么,媒体行业在利用AIGC技术提高生产力的同时,如何防范别有用心者用其制造假新闻,传播假消息?
张勇东认为,保证新闻的真实性,一直以来都是媒体的重要职责。人工智能技术生成的内容伪装性和欺骗性都很强,的确有可能会导致更多的虚假内容产生。“因此,我们要用AI对抗AI。”基于一些防御性人工智能技术,首先判断信息内容是否为人工智能技术生成,向用户发出预警。另外,随着主流价值语料库的规模不断扩大,还能够通过人工智能技术将存疑信息与语料库内数据进行对比,从而帮助用户判断出信息是否与事实相符,若为谣言,还能够列举其中哪些信息点是错误的。
据了解,由传播内容认知全国重点实验室主导,与中国科学技术大学、合肥综合性国家科学中心人工智能研究院联合推出的AI生成内容检测工具——AIGCX,可快速区分机器生成文本与人工生成文本,目前对中文文本检测的准确率已超过90%。
(责编:方经纶、贺迎春)