0

    虚拟数字人产品能不能用起来了?

    2023.05.31 | admin | 127次围观

    2023年,AIGC火出了圈,随着ChatGPT的爆火,随之而来的是虚拟数字人。数字人跻身于元宇宙和AIGC两大风口中心,再次成了创投圈瞩目的焦点。本文就虚拟数字人产品展开分析评测,以期给大家一些启发。

    2023年AIGC真的是火出了圈,尤其是ChatGPT的爆火,AI生成式算法的突破,不夸张的讲技术圈每天一个新产品、新变化,看麻木了。另外,数字人跻身于元宇宙和AIGC两大风口中心,再次成了创投圈瞩目的焦点。

    ChatGPT在数字人的智能交互性、实现个性化服务上、数字人的表现形式上以及商业化价值上等都一定程度上赋能了虚拟数字人,为数字产业和应用提供新的发展机遇和前景。而数字人作为作为元宇宙的最核心要素,或可能真正打开元宇宙。有“人”的地方就有江湖,有“人”的地方就有交易。

    什么是虚拟数字人?目前流行的解释:虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。市面上也多将其称为虚拟形象、虚拟人、数字人等,代表性的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。

    虚拟数字人的三大特征:形象能力、表达能力和感知互动能力。形象能力,即虚拟数字人拥有人的外观,具有特定的相貌、性别和性格等人物特征;表达能力,即虚拟数字人拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;感知互动能力,即虚拟数字人拥有人的思想,具有识别外界环境、并能与人交流互动的能力。

    毋庸置疑,虚拟数字人是个真需求,但目前的产业生态是否能支撑这个需求?它真的做到降本增效吗?移动互联网什么时候能因为数字人而转向?

    当前虚拟人已涵盖影视、传媒、金融、文旅、房地产、汽车以及银行证券等多场景。相信不少人也是尝鲜过数字人产品了,身边也有一些朋友做数字人直播带货,当然大部分人只是尝鲜,放弃使用是常态,考虑到成本效果等毕竟目前还是处于一个尴尬的过渡期。不过AI生成式算法的突破,将大幅提升虚拟人的语意理解能力和用户沟通能力,不同领域应用虚拟人自动化水平将得到提升。

    作者这里主要从数字人市场背景、竞品核心功能以及运营策略盈利模式几个角度来浅聊一下数字人产品这个充满希望又充满未知的物种,毕竟喜欢新鲜事物的我还是非常看好的。选择的竞品分别是腾讯智影、WarpEngine、D-ID以及HeyGen,这四款产品既有国内外,又有大小公司,以此来展开聊聊。

    先看一波百度、抖音和微信的搜索指数,微信最近倒是高了一波。

    一、市场背景

    据艾媒咨询报告,在市场规模上,2022年中国虚拟人带动产业市场规模和核心市场规模分别为1866.1亿元和120.8亿元,预计2025年分别达到6402.7亿元和480.6亿元,呈现强劲的增长态势。随着娱乐需求的增加,AI等技术不断迭代的环境下qq群聊对话生成器在线制作,中国虚拟人产业高速发展,元宇宙的热潮加速推动虚拟人产业升级。

    用户调研数据显示,中国受访者对虚拟人的知晓度达88.0%,常接触到的虚拟人类型有虚拟员工、虚拟偶像以及虚拟主播三种,其中虚拟主播的受众最为广泛达64.1%。虚拟人的应用已逐渐突破次元壁,虚拟和现实之间的相互交织,为市场开辟了一块属于虚拟生态的空间,虚拟文化也开始被大众接受。

    二、从宏观环境(PEST)来看虚拟数字人1. Politics

    国家在大力鼓励和支持新兴文化业态,发展文化产业,推动数字文化与相关新兴产业相互融合。虚拟数字人作为数字文化产业和网络直播的综合产物,是未来建设社会文化强国战略目标的重要推动力。今年也推出了相关政策。

    另外,2022年上半年北京市经济和信息化局印发了《北京市促进数字人产业创新发展行动计划(2022-2025年)》,发展目标指出到2025年数字人产业规模突破500亿元,这是国内首个虚拟数字人专项政策。

    2. Economy

    艾瑞咨询数据显示,2022年中国数字经济规模约为50亿元行业带来发展契机。

    另外,陀螺研究院的《2023年全球虚拟数字人产业报告》统计,2020年至2022年期间,全球虚拟数字人企业数量同比增长2.7倍,投融资事件从12起增加至44起,投融资总规模从1.65亿元扩大至49.88亿元,投融资总规模同比增长超29被,其中最大的一笔投资,是来自2021年韩国元宇宙虚拟社交平台ZEPETO,融资金额达12.1亿元。

    3. Society

    数字文化产业逐步成为中国文化产业发展的新增长点,2022年中国文化企业实现营收121805亿元,比上年增长0.9%。全国文化及相关产业增加值自2016年以来总体呈稳步增长趋势,增长速率与2021年已基本回到疫情前水平。2022年中国人均教育文化娱乐消费支出2469元,占总消费支出的10.1%。

    数据显示,2020年到2022年,中国网民规模呈现逐渐增长趋势,其中网络直播用户增长趋势显著,截止2022年12月,网络直播用户已达7.51亿人,占网民总人数的70.3%,其中网络虚拟主播行业在近几年随着技术的发展成为直播领域中成长最快的市场。“元宇宙”概念的火热,“Z时代”的兴起,吸引了更多的资本进入虚拟主播行业,用户和从业者规模将进一步扩大。

    (以上数据来源:中国互联网信息中心,艾媒数据中心 (data.iimedia.cn))

    4. Technology

    虚拟数字人产业的发展涉及到众多技术领域,涵盖 AI 技术、RPA、云计算、大数据、物联网、5G等。新冠疫情也加速了产业的发展和应用。

    虚拟数字人的概念也是不断随着技术的发展迭代更新的。初期,受到技术限制,人设崩坏、画面难看等被用户诟病,用户体验极差。不过这两年无论是CG、动捕、AI等技术不断革新,虚拟数字人视觉体验和制作更加成熟完美了。5G的大规模发展也给虚拟人更优的支撑。

    2022年11月OpenAI发布ChatGPT之后,生成式AI更是一路高歌。国内百度的“文心一言”、阿里的“通义千问”等产品不断更新迭代,自然语言生成技术加速提升了数字人智能化水平,应用于不同领域发挥其效果已经一个必然事件。目前,24小时直播带货已经初见端倪。

    生成式AI这样的大语言模型能助力数字人的一些优势比如:

    数据显示,截止2022年末中国人工智能企业数量接近4000家,核心产业规模(增加值)达到5080亿元。

    既然PEST都分析完了,那也不能少了SWOT。

    三、SWOT 看虚拟数字人

    优势(Strengths):

    劣势(Weaknesses):

    机会(Opportunities):

    威胁(Threats):

    总体来说,虚拟数字人作为一种新兴技术和产品,具有很多机会和潜力,但同时也存在不少挑战和风险。企业需要加强技术研发和安全保障,了解市场需求和用户需求,探索和完善商业模式和盈利模式,以提升自身在虚拟数字人市场中的竞争力,获得更好的市场发展和商业回报。

    (是的,你没有看错,SWOT这么套路的废话一看就是ChatGPT写的)

    四、竞品浅析

    虚拟数字人发展至今,诞生过不少IP,比如国内首个虚拟歌姬洛天依、讯飞的Luya、百度的度晓晓、元圆科技的天妤、阅文集团的叶修…..,相关的公司也一大堆。这都是特定角色,这篇文章只浅浅聊下作者在自媒体圈里有体验过的数字人制作平台:腾讯智影、D-ID、HeyGen、WarpEngine。

    由于这里关心的是用户对产品的使用,所以主要从和数字人相关的核心功能和运营策略以及盈利模式浅聊一下,毕竟除了核心技术,运营赚钱能力可谓是非常重要了。其他如产品体验、用户画像等这些就不分析了。

    1. 腾讯智影

    产品slogan:腾讯智影是一个集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体的在线剪辑平台,能够为用户提供从端到端的一站式视频剪辑及制作服务。

    核心功能:

    目前,腾讯智影(zenvideo)功能也比较多,各种智能小工具,这里只看下数字人播放这个核心功能,粗整理一下他的能力。

    从他的能力上来看,就是视频编辑和数字人编辑两个大方面,视频编辑的能力是常规,当然集成到数字人视频里确实也蛮强大了。数字人编辑的形象和动作目前是给定的,每个人物都对应特定形象,虽然给了展示,但目前还不允许编辑。数字人只有合成之后才能看到动态的视频,合成之前的数字人是静态的,受限于目前的技术。有文本和音频两种合成数字人的方式,从技术经验来看,这两种方式相辅相成,一定是同时出现的。

    最关心的就是数字人的姿态和表现。会员可以使用的那些数字人效果还不错,除了脸部头部唇形,还有手势的一个变化。唇形的效果和数字人角色相关,有些还是不太行,不过有的数字人还是很不错的。

    另外,关于AIGC方面的另一些能力,“文章转视频”可以实现文本自动生成,然后匹配数字人进行播报。前两个月推出配套的智影小程序也集成了AI绘画的能力,不过网页版暂时没有实现这个能力。

    运营策略 & 盈利模式:

    就看最基本的 AARRR 模型(Acquisition(获取)、Activation(激活)、Retention(留存)、Revenue(变现)和Referral(推荐))

    先贴图

    拉新:

    留存:

    促活:

    转化:

    目前的盈利模式也都比较明显,无论是C端用户还是B端,都是会员制收费。另外还有企业定制,代理商合作。

    总之,盈利模式:会员 + 企业定制 + 代理商合作

    2. WarpEngine

    产品 slogan:仅需20分钟视频,跃迁引擎即可为您制作突破自身语言、表演、时间、空间极限的超级分身。

    核心功能:

    Warpengine把视频制作和分身定制分开作为两部分。制作视频的方式有几种:pdf上传、从模板制作、直接制作,这几种到其实没太多差别,只是素材来源不一样。另外一个是创意站,这里面两种是一键生成视频和趣味视频。

    视频制作方面,提供了基本的内容元素编辑功能。数字人只能选择官方提供,音色不多,且目前看上去只支持中文。创意站里风格就多了,一键生成视频里边给的一些选项也是对标商品宣传来的,足见针对的目标群体还是很明确的。通过一些关键词,然后自动生成数字人视频,GPT集成还挺好,没看到自定义文案,难道只能和普通创建视频分开?貌似也不用。同样创意视频里也集成了AI绘画生成头像的能力,可以提供文本或音频,这里的文本也是自定义,不过这里的头像可以支持上传。最关心的数字人能力如何?好用!脸部姿势和唇形效果都不错,不过目前只有半身数字人。

    可以看到,目前是集成了一些AIGC的能力,虽然不够完善,但基本功能都有了。从官方给的版本迭代信息来看,上线迭代总共不到两月。前面给的分身定制场景对话的能力暂时还没看到,应该是下一步会有的能力,这个很期待。

    运营策略 & 盈利模式:

    先上图

    拉新:

    最主要的一个动作就是在微信里分享视频,不单纯只有链接

    留存:

    促活:

    公众号(目前是有视频没有图文)、视频号,发布相关视频。

    盈利模式:

    warpengine做的是按使用时长收费,只有10min和30min套餐,算下来8-10块钱一分钟。另外一种就是企业定制。包括一些核心功能信息展示整个看上去还是更倾向于B端用户。API也是包含在时常套餐里的,所以主要就是 套餐费用+企业定制

    3. D-ID

    产品slogan:Create and interact with talking avatars at the touch of a button, to increase engagement and reduce costs.

    核心功能:

    D-ID是国外的一款数字人产品,很简洁,就两个功能,一个是数字人视频制作,一个是数字人聊天。另外,他提供了接口供开发人员使用。

    D-id chat 号称是第一个使用 ChatGPT 实现面对面对话的应用程序,只能免费使用40次,数字人头像目前不能更换。唇形看上去效果一般,头部姿态也一般。音色是OK的,后端调用的是微软的音色库。

    头像支持自己上传符合条件的图片,也可以使用素材库里的图片,还可以用AI绘画生成。这几个方式算是很优秀了。语言支持很多种,各个国家都有qq群聊对话生成器在线制作,还有多样音色和风格可以选。试下来中文输出唇形还是一般般,英文还是不错的。

    使用上还是简洁明了,不过国外的产品对中文和头像总归还是有些差别。另外,值得一提的是开放接口给开发人员使用,这也能看出来他的产品定位。

    运营策略 & 盈利模式:

    这款产品没看到多少营销运营的策略,感情就是靠产品自然生长?

    不过盈利模式还算清晰:会员 + 企业定制 + 第三方开发使用

    提供了五种付费策略:Trial、Lite、Pro、Advance、Enterprise,整个看下来,除了贵还是贵。

    4. HeyGen

    产品slogan:The best AI video generation platform for your team

    核心功能:

    HeyGen创建数字人有4种方式:

    从URL创建:只支持亚马逊商品链接一键创建视频,做商品介绍。已有项目编辑从模板创建:提供了各种类型的模版从 avatar 创建:选择数字人编辑

    创建视频之后,一些核心内容如:数字人编辑、文本上传编辑生成、声音编辑、视频编辑等。数字人支持上传图像,支持AI绘画生成,也可以直接选择素材库里的avatar三种方式,点击数字人图像也可以作为图层做一些编辑操作。。文本可以直接输入,也可以使用ChatGPT生成脚本,当然支持直接上传声音。视频编辑可以增删改处理其他各种元素,还能上传PPT和PDF文件用来生成视频内容。

    包括音视频数字人的生成编辑功能是很齐全的了。来看下最关心的数字人效果,但只有头像的也有半身数字人,体验下来,无论中文还是英文,头部姿势包括手势身型,还有最重要的唇形都已经非常逼真了,官方给的宣传视频和模板里的数字人非常优秀,自己上传的略差一些。

    运营策略 & 盈利模式:

    还是先上图

    拉新:

    留存:

    促活:

    盈利模式:

    除了 Free,会员有两种模式,Essential 和 Pro,每种模式都可以选择对应的时长支付相应的价格。还有就是企业定制。API是包含在Pro里,只给会员使用。

    所以,目前看上去盈利模式就是:会员 + 企业定制

    五、四种数字人产品的SWOT比较

    从产品的 slogan、核心功能以及运营模式可以简单看到一些区别优劣,整理总结如下。

    以上不够全面,缺的读者自己补上。抛开技术能力不说,整体的方向就是视频编辑、融合AIGC、数字人定制化、数字人对话这些,产品目前没有很全面的,都还属于探索期,距离成熟期还很遥远。

    以上四种最好的就属heygen了,也是给其他的产品提供了思路和方向,智影的定位更偏向于一个视频制作软件,加上丰富的素材,做服务提供商是方向。d-id虽然功能单一,但如果专精数字人视频和对话的话未来提供技术服务有望。warpengine虽然不够完善,但属于刚诞生的产品,国内还是有优势,值得期待。

    六、最后的话

    作为一个很吃技术的科技行业,无论是创投圈还是普通人,都看好,但如何才能入局?降低风险?也是一个需要思考的问题。

    发展上来讲,政策也是越来越完善,产品或者创业环境还是相对不错。今年生成式AI技术更是给数字人发展提供了加速度。另外其他行业的发展也促进了更大的市场需求,而且用户接受度也在增加,“商业的尽头是带货”,数字人是重头戏。

    回到标题上,我想诸君自有答案。

    最后几个思考:

    注,本文内容仅以一个用户的角度来看,或有不符合实际产品定位等情况,请自行甄别。

    版权声明

    本文仅代表作者观点。
    本文系作者授权发表,未经许可,不得转载。

    发表评论