转高书生ChatGPT对文化元宇宙的

北京治疗白癜风技术好的医院 https://wapyyk.39.net/hospital/89ac7_knowledges.html

以AIGC(ChatGPT等)为代表的文化元宇宙前沿科技正在以超乎想象的速度改变着人类的文明进程。有人说,AIGC(ChatGPT等)的火爆出圈将导致元宇宙“熄火”,但真的是这样吗?AIGC(ChatGPT等)与元宇宙是什么关系?与文化元宇宙存在怎样的底层逻辑关联?为了深入回答上述重大热点前沿问题,中国文化产业协会文化元宇宙专委会近日举办了“文元亮见”系列专题研讨会。高书生做了《ChatGPT对文化元宇宙的启示》主旨演讲。

高书生中宣部文改办原副主任,一级巡视员

演讲正文

各位学界朋友,非常高兴受邀参加开幕式,今天我就文化数字化和文化元宇宙跟大家交流。

一、破题——从生产的角度探索文化元宇宙

首先我觉得开幕式的主题很好,“开启文化元宇宙的新纪元”,我对这个主题的理解是从生产的角度探索文化元宇宙,这个意义非常大。因为目前这个阶段我们谈到“元宇宙”的时候,应该还是在消费层面,但今天这个标题是从生产的角度,不管是过去的PGC还是UGC一直到现在的AIGC,都是从不同的生产方式来讲的,这一点还是非常有启发性的。国家文化数字化战略就是从供给侧入手的,我们叫发力供给侧,激活文化资源,推动文化生产体系现代化。

就目前来说,在元宇宙的初级阶段,主要还是从消费层面做,也应是数字化文化消费的新场景,而且是数字化文化体验的一种形式。但我觉得再往前走,实际上已经进入到一个比较高的阶段了,实现生产和消费统一,这样来推动文化元宇宙的发展会更好一些,这是我对今天开幕式主题的理解。

二、数据——数字化时代的生产要素

现在大家都已经认为数据是数字化时代的一个生产要素,但我觉得现在叫“要素”的多,叫“生产要素”的不是太多。

1.数据保真:下一步人工智能发展的充分必要条件

从目前非常火的ChatGPT谈起,ChatGPT给我们的启示有两点,一个是数据如何保真,这个可能是大家非常关心的问题。可能是我工作岗位的原因,我们更多还是从管理的角度考虑问题,所以我们在想数据的保真可能是下一步人工智能发展一个非常重要的充分必要条件。如果说数据不能做到保真,人工智能发展的方向可能就会出现一些不应有的失误。

从各种讨论文章当中大家也都看到了,目前ChatGPT训练的数据集来源大体上分为六类,包括维基百科、书籍、期刊、互联网的网站等等,训练的数据集在GPT-3里面实际上总量应该有亿的词汇,有亿的参数,这给我们的触动是非常大的,如果没有这样一个数据量训练的话,人工智能发展确实有很大制约。

这段时间大家都在测试,都是在试新鲜,看看新的聊天机器人水平到底有多高,在这个过程中,可能有些人已经提出了一些问题。大家比较关心的问题就是:互联网上的数据并不都是准确的,当错误的数据量足够大的时候,就会导致得出的结论也是错误的。有一个案例是基于GPT-3的医疗聊天机器人曾经建议病人自杀,这可能是个案,但如果个案多的话,就成了普遍性的了,归根结底就是数据的保真问题。而且现在所有的人工智能模型的学习都是基于一些历史数据,还有一些社会学学者也在研究,有可能这些数据当中存在不必要的偏见,这种偏见也会导致社会的排斥和歧视。所以说,扣好文化元宇宙第一粒扣子非常重要,我认为这是AIGC的充分必要条件,也是开发人工智能非常重要的条件。

这方面,跟我们现在正在推动实施的国家文化数字化战略有相通的地方。也就是这些数据集到底从哪里来,不光我们国人,国外也在问,在中文互联网的数据质量堪忧的情况下,我们的数据到底应该从哪里来?我们认为应该从中华民族积淀了五千多年的文化资源中转化而来,这可能是我们下一步应该重点考虑的。可能有人说你这个都是理论的东西,怎么变成现实?

其实在国家文化数字化战略当中,已经提出了非常明确的要求了。我国是文明古国,也是文化资源大国,这些年我们在推动文化数字化过程中,特别是文化资源数字化过程中,也积攒了大量的文化资源数据,这些数据大多数都集中在公共文化机构。所以说这次中办国办文件当中明确提出公共文化机构要向社会释放数据,要依法向社会公众开放,让大家都从这些数据当中提取具有历史传承价值的中华文化元素、符号和标识,并把它们转化为文化生产要素,从而就成为文化元宇宙,以及文化创新和创造的文化素材,这在国家文化数字化战略当中是非常明确的。

具体来说,我们现在数据量是非常大的,包括文化馆、图书馆、美术馆、博物馆。我们尤其

转载请注明:http://www.xibuniuzaiku.com/ylsg/12679.html

网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

当前时间: