中国文化元宇宙AIGC发展研究报告

目前这个阶段我们谈到“元宇宙”的时候，还是在消费层面，但是不管是过去的 PGC 还是 UGC 一直到现在的 AIGC，都是从不同的生产方式来讲的，这一点是非常有启发性的。国家文化数字化战略就是从供给侧入手的，我们叫发力供给侧，激活文化资源，推动文化生产体系现代化。就目前来说，在元宇宙的初级阶段，主要还是从消费层面做，也应是数字化文化消费的新场景，而且是数字化文化体验的一种形式。但再往前走，实际上已经进入到一个比较高的阶段，由实现生产和消费统一来推动文化元宇宙的发展会更好。从目前非常火的 ChatGPT 谈起，ChatGPT 带来的启示有两点，一个是数据如何保真，这个可能是大家非常关心的问题。数据的保真可能是下一步人工智能发展一个非常重要的充分必要条件。如果说数据不能做到保真，人工智能发展的方向可能就会出现一些不应有的失误。目前 ChatGPT 训练的数据集来源大体上分为六类，包括维基百科、书籍、期刊、互联网的网站等等，训练的数据集在 GPT-3 里面实际上总量应该有 3000 亿的词汇，有 1750 亿的参数，如果没有这样一个数据量训练的话，人工智能发展确实有很大制约。在大家测试聊天机器人水平的过程中，有些人已经提出了一些问题。第一个大家比较关心的问题是互联网上的数据并不都是准确的，当错误的数据量足够大的时候，就会导致得出的结论也是错误的。

有一个案例是基于 GPT-3 的医疗聊天，机器人曾经建议病人自杀。这可能是个案，但如果个案过多，就成了普遍性的问题，归根结底就是数据的保真问题。而且现在所有的人工智能模型的学习都是基于一些历史数据，还有一些社会学学者也在研究，有可能这些数据当中存在不必要的偏见，这种偏见也会导致社会的排斥和歧视。所以，扣好文化元宇宙第一粒扣子非常重要，这是 AIGC 的充分必要条件，也是开发人工智能非常重要的条件。这方面，跟现在正在推动实施的国家文化数字化战略有相通的地方。也就是这些数据集到底从哪里来。在中文互联网的数据质量堪忧的情况下，数据到底应该从哪里来？我们认为应该从中华民族积淀了五千多年的文化资源中转化而来，这可能是我们下一步应该重点考虑的。我国是文明古国，也是文化资源大国，这些年我们在推动文化数字化过程中，特别是文化资源数字化过程中，积攒了大量的文化资源数据，这些数据大多数都集中在公共文化机构。这次中国共产党中央委员会办公厅、中华人民共和国国务院办公厅文件当中明确提出公共文化机构要向社会释放数据，依法向社会公众开放，让大家从这些数据当中提取具有历史传承价值的中华文化元素、符号和标识，并把它们转化为文化生产要素，从而成为文化元宇宙以及文化创新和创造的文化素材。

声明：本站所有报告及文章，如无特殊说明或标注，均为本站用户发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

文章展示

5G Advanced通感融合网络架构研究报告

自动草稿

互联网行业：5G_Advanced通感融合网络架构研究报告

2024年移动互联网亲子行业研究报告

华泰证券通信专题研究：运营商，从全球对比视角看投资价值

工业互联网行业：新型工业互联网平台参考架构

最热报告

2020信创发展研究报告及60强企业

互联网下一个正循环：从业务、战略、能力看百度下一个五年

“消费与美好生活”调研报告

消费升级背景下零食行业发展报告

2021年中国智慧医疗行业发展研究报告

2020年中国跨境电商供应链专题研究报告

艾瑞咨询：中国VR AR市场研究报告

2020年互联网人才招聘白皮书

食品饮料行业 2013年投资策略

海外疫情重新影响供应链新能源原材料锂、钴价格全面上行——中观行业数据观察