球速体育·(中国)官方网站。有趣实用的生活常识!

最新更新文章排行

球速体育·(中国)官方网站QIUSU SPORTS

当前位置: 球速体育·(中国)官方网站 > 情感

生成式人工智能驱动下的网络音频产业变革:实践与挑战——以“喜马拉雅”为例

时间:2024-07-12人气: 作者: 小编

  生成式人工智能驱动下的网络音频产业变革:实践与挑战——以“喜马拉雅”为例

  摘要:【目的】网络音频产业是数字技术革命和互联网普及下的产物。本文的研究目的是探讨生成式人工智能驱动下网络音频产业的创新路径。【方法】本文通过文献研究、案例分析、归纳总结等方法,梳理了生成式人工智能背景下的网络音频产业的发展现状、创新实践以及机遇挑战。【结果】网络音频产业在生成式人工智能的驱动下,实现了内容产品的提质增量、精准分发、定向营销,提高了消费者的付费意愿和黏性,但也带来了消解生产边界、盲目迎合用户需求、泄露数据隐私和版权纠纷等问题。【结论】在生成式人工智能驱动下,网络音频产业要明确自身定位,完善推荐机制,以规避数据隐私泄露风险,健全版权保护。

  本文著录格式:王超群,李康为 . 生成式人工智能驱动下的网络音频产业变革:实践与挑战——以“喜马拉雅”为例 [J]. 中国传媒科技,2024,36(6):26-32.

  基金项目:湖南省社科评审委员会项目“数字技术赋能湖南红色文化国际传播的创新实践研究”(项目编号:XSP24YBC034)阶段性成果。

  作者简介:王超群(1982—),女,湖南郴州,湖南科技大学人文学院副教授,研究方向为媒介经营与管理;李康为(1999—),男,湖南耒阳,湖南科技大学人文学院新闻与传播专业硕士研究生,研究方向为媒介经营与管理。

  网络音频产业是指声音内容搭载移动互联网渠道传播的音频产业,具有间歇性、伴随式体验、高用户黏性等特征。[1]2022 年,中国网络音频产业的相关市场总产值攀升至 115.8 亿元,比上一年增长了 15.6%。网络音频产品消费者规模增长至 3.1 亿人,同比增长3.2%。在收入构成上,不同的盈利途径呈现出均衡健康的发展态势。用户支付的订阅费用构成了该行业盈利的最大部分。此外,广告营销活动的收入保持稳定,而直播打赏等创新服务业务则展现出了显著的增长势头。这些因素共同为网络音频产业在未来几年的稳定和快速增长提供了强劲动力。

  目前,我国网络音频产业主要形成了以喜马拉雅、蜻蜓 FM、猫耳 FM、荔枝、云听为代表的产业格局,各平台依靠自身优势积累了不少的用户,拥有稳定的用户群体。根据《中国网络视听发展研究报告(2023)》显示,在我国的网络音频产业中,喜马拉雅以 73.5%的市场占有率稳居第一梯队,其次,蜻蜓 FM 和猫耳FM 以 9.8% 的市场占有率位列第二梯队。[2]

  2024 年 1 月喜马拉雅发布《2023 喜马拉雅中文播客生态报告》,该报告展示了网络音频产业的最新数据和态势。喜马拉雅平台有 24 万档播客具有商业变现价值;平均月活跃听众 3.03 亿,周活跃数 1600 万人,用户累计收听时长 4.44 亿分钟,该群体主要为一、二线青年听众,用户画像为高收入、高学历、年纪轻且闲暇时间少的白领阶层。[3] 中国互联网络信息中心发布的第 53 次《中国互联网络发展状况统计报告》显示,截至 2023 年 12 月,我国网民规模达 10.92 亿人。[4] 以3.03 亿听众来看,每 10 个网民中至少有 3 人为目标受众。同时该平台移动端平均月活跃付费用户达到 1580万,移动端平均月活跃付费会员数也达到了 1550 万。截至 2023 年 12 月,喜马拉雅已连续实现 5 季度盈利,2023 年全年经调整净利润达 2.24 亿元。

  近年来,随着人工智能技术的不断发展,与网络音频产业相关的人工智能技术,如语音识别技术(ASR)、自然语言处理(NLP)、语音合成技术(TTS)、实时音频技术(RTC)等,正在逐渐介入网络音频产业的各个环节,优化了内容生产流程,提高了传播效率。ChatGPT 首次出现在公众视野是在 2022 年 11 月 30 日。这款基于 GPT-3.5 系列大型语音模型微调而成的对话式 AI 模型,因其强大的语言理解和生成能力,被广泛应用于各行各业。生成式 AI 的普及,让基于“耳朵经济”的网络音频产业有了更大的发挥空间。随着国家宏观层面大力布局人工智能、大数据、5G 等技术发展,驱动网络音频产业步入发展快车道,工业和信息化部正积极探索将人工智能、5G、大数据等关键技术纳入“十四五”国家专项规划,在国家层面的顶层设计和推动下,人工智能、5G、大数据等前沿技术的快速发展,将深刻影响网络音频产业的全链条,助力内容制作、分发和营销等各个环节,为网络音频产业全场景覆盖提供了 “万物互联” 的网络支持和 “语音交互”的技术支持。[1] 作为网络音频产业的先行者,喜马拉雅将科技创新作为企业发展的核心驱动力,勇于尝试和探索,在产业链的生产、分发、营销、盈利四个环节都注重运用 AIGC,以期为用户带来更加智能化、便捷化的音频体验。本文尝试以“喜马拉雅”为例,从“实践”与“挑战”两个方面探讨生成式人工智能给网络音频产业带来的变革。

  从网络音频产业的实践看,网络音频平台在内容生产、分化营销和互动传播等方面不断进行创新和升级,从最初的用户自发、制作简陋的 UGC 生产阶段逐渐过渡到专业化、精品化的 PGC 生产阶段,随着生成式人工智能的横空出世,生成式人工智能得益于硬件性能、预先训练模型和多模态交互技术的持续优化与革新。目前已经被广泛应用于网络音频产业的生产、分发、营销、盈利等各个环节,引发了网络音频产业又一轮新的变革。

  2022 年喜马拉雅实现了首次千万级的季度盈利,与此同时,荔枝 FM 在 2023 年发布的 2022 年度财报中披露,该公司全年的收入增长到了 21.85 亿元人民币,净利润为 8650 万元,这也是荔枝首次实现全年盈利。这两家网络音频平台的成功盈利,为在线音频行业注入了新的活力,使得该领域的关注度和热度再次上升。

  目前,AI 语音识别和 AI 语音合成在音频制作中逐步成熟,大大促进音频内容生产新形式的发展和内容生产的效率。在技术创新上,喜马拉雅于 2023 年投入研发费用 9.3 亿,占总营收的 15.1%,其技术和研发团队占员工总数的 44.3%,同时为了应对数字化浪潮的挑战。其专门成立“珠峰实验室”,研发“珠峰音频 AI 模型”。促使其内容生产模式从 PGC、UGC 向AIGC 延伸,并且已将自动语音识别技术、语音合成技术等,广泛应用于评书、新闻、小说等内容制作中。具体来看,通过 AI 合成音、AI 演播的方式生产数千本、数万本有声书,可以替代真人朗读,带来平台成本投入的减少,以及利用 AI 技术为创作者提供更具效率的生产工具,也能让内容生态的运转效率提高,从根本上降低经营成本。喜马拉雅 CTO 姜杰表示,喜马拉雅在技术的创新和应用中很重视观察人和 AI 交互协同能产生什么全新的价值增量。音频内容呈现更智能化的趋势背后,将是 AIGC 对于喜马拉雅原有的UGC+PGC+PUGC 的音频生态的进一步丰富。

  相比于机器人来说,个体之间因为不同的性格、际遇、生活环境造就个体之间的不可复制性,优质的音频内容生产被消费者所喜爱一定程度上也是因为其独特性。例如我国著名评书艺术表演家单田芳老师,十分擅长用声音塑造角色,单老标志性的“云遮月”嗓音成为独一无二的内容符号,在民间甚至留下了“凡有井水处,皆听单田芳”的说法。单式评书是中国非物质文化遗产,拥有庞大的粉丝群体,是一个大IP,为了复刻单田芳的评书风格,喜马拉雅智能语音实验室利用 TTS 技术将单田芳先生的声音解码,并为其设计了单独的韵律提取模块,最后结合 HITTS 技术框架,让单老的 AI 合成音仿佛本尊再现,使受众享受到更多单田芳先生的优秀作品。目前喜马拉雅上已有近百部运用单田芳先生 AI 合成音制作的专辑,这些专辑受到用户的追捧,部分评书专辑长期霸榜喜马拉雅相声评书热榜前列,其中《蜀山剑侠传》《解密开国将帅传奇故事》《民国四大家族》的播放量均超 500 万。

  AIGC 作为一种新的内容生产模式,可以实现以十分之一的成本,以百倍千倍的生产速度去生产 AI 原创内容,例如喜马拉雅原创 TTS 音色“喜晓峰”“枪枪”已被应用于《听秦说》《36 氪·氪金大事件》等财经专辑内容中。其中,“秦朔朋友圈”账号下《听秦说》专辑在使用喜马拉雅 TTS 技术后从每周一更轻松实现每日一更,同时专辑的播放量和互动数据都显著提升。AIGC 不仅助力喜马拉雅内容创作者实现内容生产的提质增效,推动创作者布局音频生产,实现网络音频产业的升级转型,也为用户带来更加丰富的体验。

  《中国网络视听发展研究报告(2024)》显示,喜马拉雅系用户渗透率为 77.8%、蜻蜓 FM+ 猫耳 FM用户渗透率为 9.3%。喜马拉雅在网络音频行业占据着第一梯队的地位。[5] 在网络音频产业中,内容生态和付费用户数量是支撑企业发展的基础,喜马拉雅在用户渗透率之所以能够在同行业中遥遥领先,其背后的智能推荐机制功不可没。喜马拉雅通过其独有的生成式 AI 模型和大数据技术对用户数据进行深度数据挖掘与分析,开发了一套依托于人工智能的内容推荐和发现系统,同时构建用户智能标签体系。这些技术的运用显著提升了内容推送的精准度与高效率,并优化用户在使用平台时的整体体验。因此,在同行业的其他竞争者中,喜马拉雅凭借这一显著优势脱颖而出,构筑了市场竞争力。

  喜马拉雅的核心竞争力之一是能够根据用户的偏好和习惯智能推荐个性化内容。这种个性化推荐系统是利用机器学习和生成式人工智能技术,喜马拉雅的AI 智能推荐系统通过收集用户的收听历史、搜索记录、点赞和分享行为等数据,构建用户画像,同时结合用户的活跃时间段和兴趣标签为用户推送内容,该系统还具备协同过滤技术,通过分析具有相似偏好的其他用户的收听内容,为当前用户推荐可能感兴趣的内容。在用户收到系统分发的内容后,通过对用户收听行为进行分析,用户对推荐内容的互动行为(如跳过、回听)会被用作实时调整推荐算法的依据,推荐系统会不断优化算法,调整推荐逻辑,以应对用户偏好的变化和新内容的加入。最终,所有技术的运用都指向提升用户体验,喜马拉雅通过智能推荐系统增强用户的使用黏性,提高用户满意度和留存率。

  并且为了使 AI 智能系统推荐的内容可以被受众收听,喜马拉雅的“珠峰音频 AI 模型”结合语音信号处理技术(SSP),在长音频领域创新性地引入了 AI 智能音效功能。该平台已经发布了三种专属音效模式,分别是“超重低音”“剧院混响”“清澈人声”,这些音效被设计来满足不同用户对音效的个性化需求,并增强各类音频内容的听觉效果,以达到系统推送的内容被用户收听的效果。

  喜马拉雅计划在未来不断完善 AI 智能推送系统,以进一步提升用户体验和平台的个性化服务能力。不断对现有算法进行深度优化,使其能够更细致地捕捉用户的即时需求和长期偏好。同时喜马拉雅将加强内容分析能力,通过自然语言处理和深度学习技术,更准确地理解音频内容的深层含义和用户的情感反应,以期在网络音频产业的激烈竞争中保持领先地位。

  人工智能技术的快速发展,尤其是可解释人工智能、机器学习、大语言模型、多智能体系统等生成式人工智能技术的兴起,正在深刻影响和重塑着网络音频产业营销的理念、模式和实践。生成式人工智能可以优化广告创意和营销文案,从营销目标、竞品分析、营销场景、用户需求等维度自动生成营销文案和广告,提高产品的转化率和投资回报率,同时根据面向的平台、媒体、场景调整广告文案的风格和样式,以适应不同的传播环境。

  如何使音频讲好故事,提高用户黏性和产品转化率,一直是喜马拉雅着力攻克的课题。传统的营销广告如开屏广告、贴片广告,虽曝光度高,但是用户更加倾向跳过广告,而音频广告的最大优势便是它的伴随性和独占性。为了构建独特的营销场景和营销模式,喜马拉雅致力于汽车品牌的跨界合作,围绕五菱汽车创新自研 LingOS 灵犀系统特性,使用生成式 AI 技术适配系统,以海量优质音频内容为载体,为车主量身定制喜马拉雅五菱专属电台,实现“车-人-生活”数据高效智能融合,无缝覆盖车主出行、娱乐、社交、用车全场景。此外,喜马拉雅还通过 AI 技术和深度学习方法,在基础音轨阶段就呈现出优质效果,为用户带来更加自然、真实的听觉感受。

  生成式人工智能对产品营销的赋能在耳朵经济中崭露头角,许多网文作品在喜马拉雅 AI 音色的加持下等到了翻红的机会,黑岩网旗下的网文作品《捡漏》由于版权原因长期“束之高阁”,喜马拉雅使用了四位 AI 音色——喜小道、喜小迪、喜小玖和苏小刀完成了这部 AIGC 有声书的内容制作。用户可以根据自己的需求选择声音播讲这部有声书,同时这部作品上线喜马拉雅“免费畅听”专区,受到了广大听众的追捧,这部经典作品在 AI 的加持下得到了重新的展现和推荐,平台累计播放量已突破 1.1 亿。目前,生成式 AI已经在其内容生产、产品营销等各方面发挥着重要作用,平台移动端平均月活跃用户的生成式 AI 渗透率已达 14.8%。

  通过生成式 AI,喜马拉雅能够为用户提供更加丰富和个性化的音频内容,并且准确识别具有独特特征的细分市场,并为这些市场定制个性化内容,提高营销的针对性和效果,拓宽了营销的触点。同时借助生成式人工智能,喜马拉雅不仅提升了自身的营销效率和效果,而且为用户提供了更加沉浸式和定制化的音频体验,同时也推动了音频行业的创新和发展。

  随着音频传输质量的提升、智能化互动的不断深化以及应用场景的持续扩展,在线音频内容消费时长伴随着技术升级正在加速驶入发展快车道。根据 2024 年4 月 12 日喜马拉雅在港交所更新的招股书显示,2021—2023 年喜马拉雅经调整净利为 -7.18 亿元、-2.96 亿元、2.24 亿元,平均月活跃付费用户分别约为 1490 万、1570万和 1580 万,移动端付费用户 2021 年至 2023 年的付费率分别为 12.9%、12.9% 和 11.9%,日活用户收听时长也从 2021 年的 144 分钟降到了 2023 年的 130 分钟。虽然连年亏损的喜马拉雅扭亏为盈,但是在月活用户、付费用户和使用时间,这三个音频产业最关键的运营指标上,喜马拉雅都出现不同程度的放缓或下降。作为在线音频平台,最主要的收入来源便是付费群体的消费,因此如何提高付费群体的活跃时长和挖掘潜在

  老牌网络音频产业的商业想象力已经接近匮乏,亟须找到新增长点。于是它们盯上了这两年最火热的项目:生成式人工智能。在 AIGC 浪潮下,2024 年初喜马拉雅旗下的 AIGC 平台喜韵音坊升级为一体化创作者工具品牌“音剪”,使用者也从 2022 年的 1.8 万人增加至 3.1 万人。音剪平台为创作者提供了 89 种 AI音色,无论是初出茅庐的音频剪辑新手,还是经验老到的平台主播,都可以根据自己的需求选择合适的 AI音色进行创作。同时音剪内置的 AI 模型可以根据创作者提供的音频素材一键完成问题检测、文字剪辑和智能包装,简化创作者的工作流程,提高创作者的创作热情。以及音剪上线的 AI 文稿功能,可以有效识别无文稿音频内容,根据上下文内容自动生成文稿;对于已有原始文稿的音频内容,则采用音频文稿对齐技术,将声音和文稿进行时间戳对轨,从而在声音播放的同时,实现对应文字同步高亮,做到声字同步,让用户能更便捷地享受边听边看的内容消费体验。这不仅有利于增强用户黏性,还可以进一步拓宽喜马拉雅的多元化使用场景。

  2024 年 4 月 22 日喜马拉雅发布的《2024 春季有声阅读数据报告》显示,16.77% 喜马拉雅高黏度优质付费用户为订阅儿童 VIP 的会员人群,这反映出有声阅读正日益成为助力儿童教育的重要方式。同时根据其后台数据显示喜马拉雅三分之一的用户为育儿用户,并且高黏度优质付费用户中,已育用户占比高于全站,81.5% 已育高黏度优质付费用户的孩子年龄集中在 3-10 岁。[6] 因此喜马拉雅借助研发的“珠峰音频AI 模型”,家长可以将自己的声音嵌入喜马拉雅儿童故事库,其只需要简单地录制 5 段音频文本,系统将会对这些文本进行分析、训练,从而定制个性化音频内容,成功后即可在“爸妈讲故事”页面或支持 AI 转音的专辑中播放自己的声音,从而为亲子共读提供更个性化的体验,提高付费群体的消费意愿。

  自从生成式 AI 被应用于市场,网络音频产业的内容供应方和需求方都把它视作一种在内容创作过程中降低成本和提高生产力的关键工具,对其未来的业务模式拓展及商业模式创新充满期待,然而也必须注意到,随着智能技术的应用逐步替代人类的决策和行动,其可能引发的技术负面性问题。[7]

  在传统音频产业时期,网络音频生产者从事音频创作需要拥有基本的音乐知识和对音频理论有一定的了解,同时还要具备一定的物质条件,如音频录制设备、音频处理设施、音频编辑软件等软硬件条件,更加规范地还需要专业的录音场地,以减少录音时产生的回声和噪声。只有具备这样的基础条件,才能完成音频创作、录制、剪辑等全流程生产。而人工智能技术的快速发展给网络音频产业带来了前所未有的变革,音频生成逐渐形成了以“文本分析-声学模型-声码器”为基本结构的语音合成方法。网络音频的生产边界逐渐消解,同时人工智能赋能音频生产释放了难以估量的生产力,生成式人工智能生产音频可以实现文本到音频的直接转化,基于已有的音频数据,结合大语言模型,可以轻松打破人机生产边界实现“文产音”的高质量效果。

  生成式 AI 在音频制作领域的应用正逐渐改变内容创作的生态,生成式 AI 凭借大语言模型生成音频的成本相对较低,它减少了对于专业录音设备和人员的依赖,这无形中挤压了专业音频制作市场和音频生产者的生产空间,同时过度依赖 AI 技术可能会导致创新能力的下降,减少内容创作者的参与热情和创作动力,AI 生成的音频可能因缺乏情感表达和创新性而无法完全替代人类创作者,但它们在成本效益和生产速度上的优势,无疑对专业音频制作市场构成了压力。根据喜马拉雅 2024 年向港交所更新招股书显示,喜马拉雅在 2 年之内合计裁员 1705 人,裁员比例高达39.26%,其中产品岗裁员最多。无疑生成式人工智能在一定程度上减少了对人类创作者原创作品的需求,这直接冲击了专业音频制作人员的市场地位。

  随着 AI 技术的普及,市场上出现了大量由 AI 生成的音频内容,这加剧了音频产业的市场竞争。普通音频制作者不仅要与其他人类创作者竞争,还要面对AI 这一新兴的竞争对手。在价格和速度上,普通创作者往往难以与 AI 相抗衡,这直接威胁到了以音频创作为生的人的生计。AI 生成的音频可能缺乏人类创作者的深度和情感,但它们足以满足某些商业应用的需求,使得网络音频市场的竞争更加激烈。

  生成式 AI 在内容生成方面展现出巨大潜力,能够根据用户的个性需求定制化生产内容。然而,这种技术在满足用户个性化需求的同时,也很容易让受众陷入信息茧房的风险之中。生成式 AI 的算法通常基于用户的历史行为和偏好进行学习,这可能导致算法过度关注用户的已知喜好,而忽视了提供多样化信息的重要性,同时生成式 AI 的算法推荐所具有的隐蔽性、信息片面性、排他性,容易将用户驯化为信息的奴隶,从而影响受众的认知。

  生成式人工智能基于语言模型,通过对大量历史文本进行数据处理,对已有内容进行分析、学习和再造,所以生成式 AI 生产的音频内容往往都是根据当前平台的热门搜索,如现代言情、都市、玄幻等种类生成音频产品,但是生成式 AI 无法识别文字或音频背后所带有的价值观和文化道德,同时机器生产的内容具有滞后性,因为生成式 AI 的知识基于它在训练时所接触的数据,无法实时更新或学习新的信息。同时算法歧视所带来的伦理问题一直贯穿于人工智能技术的全过程。因此相关技术人员或使用者在训练生成式 AI 时输入的数据中带有主观价值的内容,而算法无法准确识别这种偏见或歧视性言论,这些算法可能会在生成的内容中复制并放大现实世界中的刻板印象。2024 年国际妇女节前夕,联合国教科文组织发布研究报告,揭示了令人担忧的事实:大型语言模型(LLM)存在性别偏见、恐同和种族刻板印象倾向。在大型语言模型的描述中,女性从事家务劳动的频率是男性的 4 倍,此外,女性名字常常与“家”“家庭”和“孩子”等词汇联系在一起,而男性名字则与“商业”“管理层”“薪水”和“职业”等词汇联系在一起。

  生成式 AI 在网络音频领域的应用带来了巨大的便利和创新,但同时也带来了信息茧房的风险。当用户只听取与自己意见一致的声音时,他们可能会变得更加固执己见,难以接受不同的观点。这可能导致社会对话的减少,增加社会冲突和分裂。同时如果 AI 系统只推荐那些符合用户历史偏好的内容,那么新颖和非主流的内容可能会被忽视,从而限制了音频产业的创新潜力,不利于网络音频产业的长期发展。

  生成式 AI 给网络音频产业带来的不仅仅是音频产品生产速度的提升,生成式 AI 也具备深度自我学习、决策判断、模仿和创作的能力,即生成式 AI 可以在认知层面基于对音频内容理解,对音色、语气、情感色彩的独立分析、挑选和匹配,极大提升了音频制作的效率和质量,为网络音频产品营销注入了前所未有的强劲动力。

  生成式 AI 重塑了整个网络音频产业,带来了产业的繁荣兴盛,但背后带来的数据安全威胁和隐私风险仍然不可忽视,生成式 AI 的训练依赖大量的数据输入,开发者可以选择特定的数据集和算法来影响内容的生产,其中难免带有数据偏见或意识形态的植入。目前生成式 AI 采集的个人数据种类繁多,并与多种应用场景紧密相关。随着数字技术的不断融合发展,用户的个人身份信息,如面部特征、电话号码、家庭住址等,都与他们的数字身份高度关联,一旦泄露可能会造成无法估量的风险。与此同时,对用户的个人偏好、外貌、性格等描述信息的恶意利用也可能会导致个人身份的泄露。[8]

  研究发现,生成式 AI 模型拥有一定的记忆功能,能够存储和回顾特定的训练数据,在模型训练前即使对数据进行了清洗,也难以有效去除个人信息,这些数据可能蕴含着敏感的个人信息,一旦泄露将导致大规模的隐私风险。哪怕事先对个人信息去标识化,生成式 AI 依然能够通过分析匿名数据,利用数据间的关联和逻辑推理,恢复出个体的身份和特征信息。同时,尽管生成式 AI 拥有多种安全防御机制,但模型的安全性仍然难以得到全面保证,存在被攻击的风险,并且生成式人工智能的架构设计和训练阶段极为繁琐,因此遭遇的安全风险多种多样。尽管已经实施了众多安全防护措施和保护策略,但在技术较量不断加剧和恶意侵入愈演愈烈的情况下,要确保 AI 模型的全流程安全仍然是一项艰巨的任务。

  Web1.0 时代的内容生产模式主要是 PGC 主导,内容的版权主体多为机构或个人。Web2.0 时代的内容主要是由 UGC+PUGC 生产,其版权所有者多为用户或者是用户与签约的公司共有,而 Web3.0 时代的 AIGC内容生产模式,智能算法和智能机器能否可以成为版权所有者依然具有争议。同时在 AIGC 的作品认定过程中,智能算法和智能机器生产的内容是否拥有内容独创性是当前的最大争议,生成式人工智能生产的内容更具技术主导性,往往依托自然语言处理、情感分析、语义角色标注等技术,人类对内容生产的参与仅仅局限在一开始的算法模型设计、数据“投喂”、生成引导等环节,同时投喂的数据是否获得了版权所有者的同意,往往难以考究。

  并且我国现有法律对于独创性标准的立法较模糊,在现有的实践过程中出现了主观论和客观论两种解释模式。主观论基于“作品是源自作者独立完成的、带有个人主观价值的创造,彰显了其独到的洞察力和创造力,是作者思想和感知的结晶”,因此认为人工智能生成的内容是基于大语言模型自动生成,未能体现作者的个性特征和创造力,因而不具有独创性。客观论则从作品客体出发,认为内容本身只要“呈现出与其他作品相异的独特理念和思考”,便认定没有涉及剽窃等行为,就满足了独创性的标准。[9]因此可以认为,鉴于对独创性标准的不同诠释,生成式 AI 的作品版权和独创性认定深陷困境。

  生成式 AI 生成的内容版权不明,无疑会给产品的销售和盈利带来影响,AI 生成内容的版权问题直接关系到创作者和企业的利益。如果 AI 生成的内容不能明确版权归属,那么原创作者可能会失去对作品的控制权,从而影响到他们从作品中获得的经济利益。同时,企业在推广和销售这些产品时,也可能会因为版权的不确定性而面临法律风险,这无疑会增加企业的运营成本和潜在的诉讼费用。版权的不明确性也会影响消费者的购买决策,还可能引发公众对 AI 技术的信任危机,消费者可能会担心 AI 生成的内容侵犯了他人的知识产权,这种担忧会进一步抑制市场需求。

  目前,网络音频产业出现了一种对生成式 AI 生产内容的过分追捧趋势,这种 AI 音频迅猛发展的同时也给网络音频产业带来了一系列的挑战,包括挤压生产者的生产空间、信息茧房、数据隐私安全和版权纠纷等问题。因此,在生成式 AI 备受追捧的当下,我们有必要未雨绸缪,防患于未然,通过提前完善风险评估和规避策略,建立新的媒介社会效益和科学传播体系,以应对生成式 AI 对网络音频产业可能引发的社会风险。

  第一,为应对生成式 AI 的冲击,网络音频生产者需要提升自身内容质量和创意,打造个人品牌形象。生成式 AI 虽然能快速生成内容,但往往缺乏人类创作者的深度和情感。音频生产者应专注于创造具有独特风格和情感共鸣的高质量内容,以此来吸引和维系听众,同时注重个人品牌的打造,通过创建有吸引力的个人形象、声音风格和内容主题来树立个人品牌。此外,生产者还需加强与听众的互动,通过社交媒体和在线社区等渠道收集反馈,不断优化内容,提高用户参与度和忠诚度。同时,网络音频生产者应密切关注 AI 技术的最新进展,理解其对音频产业的潜在影响,并准备好适时调整自己的内容生产策略,用 AI 技术辅助内容生产,争取在激烈的市场竞争中脱颖而出。

  第二,在网络音频产业中,信息茧房现象可能表现为用户在个性化推荐系统的影响下,只接触到与自己已有兴趣相符合的音频内容,从而可能导致视野狭窄和认知偏差。同时受众对于 AI 算法推荐系统的了解程度和效能感较低,而无法感知自身认知窄化,从而陷入信息茧房的风险之中。用户应该定期调整平台的推荐设置,以确保推荐系统不会总是推送相同类型的内容,同时主动搜索和收听不同风格和主题的音频内容,以拓宽自身视野,并且培养批判性思维能力,对接收的信息进行分析和质疑,而不是被动接受。网络音频平台也需要不断优化推荐算法,在提供个性化内容的同时,也能推荐多样化的内容,避免用户视野的过度窄化。提高推荐系统的透明度,让用户了解为何会收到特定的推荐,增加用户对推荐过程的控制权,做到定期审查和调整推荐系统,确保推荐内容的多样性和高质量,避免单一化和极端化。

  第三,随着生成式 AI 赋能网络音频产业的快速发展,目前迫切需要关注的是其带来的数据安全和隐私风险。一是在管理过程中始终要以国家安全和信息安全为底线,秉持既要“音频发展”又要“音频与信息安全”的双重原则,不断完善生成式 AI 管理的法律规范,《关于规范和加强人工智能司法应用的意见》《生成式人工智能服务管理暂行办法》的出台,为生成式人工智能的管理提供了法律依据,进一步促进生成式人工智能向好向善发展。二是要进一步明确需要管控的数据和隐私类型,确保平台操作符合国家关于数据保护和隐私的法律法规,避免法律风险和经济损失。三是完善海外音频数据和个人隐私信息流入的审查机制,通过保护用户隐私和建立良好的数据保护机制,为海外市场的拓展打下坚实的基础。

  第四,版权问题是所有生成式 AI 都将面对的问题之一,我国 AIGC 的版权问题依旧是灰色地带。为了贯彻“边发展边治理”的方针,政府需要制定具有适应性的规定,以便对 AI 音频产业进行适时的引导和规范。同时在技术层面加强研发生成式 AI 检测技术,能够有效地区分和识别音频创作的责任主体,进一步降低知识产权侵权等行为的发生频率。在政策制定方面,应在现有的法律框架基础上,加速确立生成式 AI 音频版权保护的具体定义和类别,清晰界定何种行为构成侵权、侵权行为的分类及其判定准则,以及侵权行为发生后的赔偿机制等关键的法律议题。通过技术和法律的双重保护,积极化解版权保护纷争,完善产业规范。

  全媒体时代,生成式 AI 凭借其数据处理、内容生产、营销分发等方面的强大功能,重塑了网络音频产业的行业生态,构建了网络音频产业协同创作和传播的桥梁,赋能音频文化创作场景愈发多元,从而促进网络音频体验模式多元化与纵深化进阶,网络音频的生产与传播在技术的加持下变得更加高速与智能,给我国网络音频产业发展带来了全新的机遇与挑战。如何以生成式 AI 引领网络音频产业的创新发展,是将来优化我国网络音频产业布局、提高网络音频产业盈利能力、加强网络音频产业的抗风险能力和持续性发展的重要议题,也是决定我国网络音频产业能否长久健康发展的关键所在。

  [1] 潘浩元 .2023 年中国网络音频产业研究报告 [C]上海艾瑞市场咨询有限公司 .2023 艾瑞咨询 8 月研究报告会论文集 . 艾瑞咨询 TMT 业务部,2023:41.

  [8]武林娜,宋恺,王淞鹤 . 生成式人工智能对个人信息安全的挑战及应对策略 [J]. 信息通信技术与政策,2024 (1):13-18.

  [9] 蔡琳,杨广军 . 人工智能生成内容(AIGC)的作品认定困境与可版权性标准构建 [J]. 出版发行研究,2024(1):67-74.

  原标题:《生成式人工智能驱动下的网络音频产业变革:实践与挑战——以“喜马拉雅”为例》球速体育官方网站

标签: 情感文案500个  

本类推荐