0

    钉钉“抢跑”接入阿里大模型,总裁叶军:最大挑战是商业化

    2023.05.17 | admin | 193次围观

    在阿里巴巴正式发布AI大模型一周之后,钉钉以“抢跑”的速度举办2023春季钉峰会,公布接入通义千问后的新功能:通过输入斜杠“/”可以唤起整理群聊要点、生成表情包、写文案、做海报、会议助理、生成应用等10余项AI能力。

    “不做Chat PPT,今天我们现场演示钉钉的AI功能‘魔法棒’”“这个功能可能要翻车……没翻车挺好!”“通义千问还是要继续学习,现在写出来的文案跟我的水平差不多”……在一个小时的功能演示中,钉钉总裁叶军金句频出,引发掌声和笑声不断。

    今年以来,与生成式AI相关的峰会大都人头攒动、座无虚席,钉钉峰会上同样如此,现场有初创企业也有大型央企、学校,其中不少参会者因为现场座位不够只能站着听,可见行业对于生成式AI应用的热情之高。

    然而,生成式AI从玩具走向工具仍面临算力是否够用、监管如何落地等诸多挑战,发布会后钉钉总裁叶军接受南都采访时表示,有自信用最好的算力条件来完成用户使用场景的全覆盖,监管通过之后聊天场景的AI功能可以让90%的用户用上,“我们的目标到今年年底,核心场景全部有智能化能力qq群聊对话生成器在线制作,不是一两个场景,是几乎所有场景。”

    “抢跑”发布四大AI功能

    4 月 11 日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在云峰会上表示,阿里巴巴所有产品将接入千问大模型,进行全面改造。张勇认为,AI时代所有产品都值得用大模型重新做一遍。

    在千问大模型面世一周后,钉钉最先确认接入千问。叶军现场演示的四个场景为:群聊、文档、视频会议及应用开发。

    在群聊中,新入群者无需爬楼,在对话框输入钉钉斜杠“/”即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程。还可以用“/”在群聊中创作文案、表情包等。

    在聊天中,用户也可以训练专属的助理机器人。用“/”创建机器人后,只需要发送文档、网页或者知识库的一条链接,就可以让机器人自动学习其中内容,并可生成对话问答,不用再手动设置问题和答案。

    在钉钉文档中,“/”可以是用户的创意助理,帮助写文案、生成海报。在视频会议中,“/”则是会议助理,能一键生成讨论要点、会议结论、待办事项等。

    最令人惊艳的是,“/”还可用自然语言或拍照生成应用,并以钉钉酷应用的形式在群聊内使用。比如,公司行政人员需要统计午餐的订餐份数,只需要在群聊对话框中输入“/”和需求,几秒钟后一个订餐统计小程序就会展现在群聊中。

    谈及应用的上线速度,叶军表示,钉钉必须跑在最前面才能避免算力不足需要排队的情况。

    “我们一定要成为第一个。因为现阶段可以独享大部分(算力)资源。如果将来高德、淘宝、天猫都开始用了,我们可能也得去排队,这是云钉一体下的小小优势”,叶军称。

    算力可支持90%用户在聊天场景下使用AI

    值得关注的是,当天钉钉“个人版”也首次亮相,主要面向个人用户、小团队、高校师生等群体,同样会全面接入千问大模型。

    据介绍,除了应用在钉钉企业版的群聊、文档、视频会议及应用开发四个高频场景,钉钉也在同步测试将AI功能接入钉钉个人版、搜索、邮箱、AI助理、智能客服等产品中。

    谈及算力能否支撑个人用户的大规模使用,叶军向南都记者表示,在即时通信场景下,可以保证90%的人每天使用,“这不是技术难点问题,产品已经准备好了,在IM上的算力消耗我们可以接受,因为只是文本处理,我们预测过,每天每个人点一次,问题不大。”

    在AI功能抢先测试完成之后,监管仍是钉钉必须面对的问题。目前,钉钉与大模型融合场景正在测试中,具体功能将在相关安全评估完成后上线。“客观讲是AI是一个黑盒,或者说炼丹炉,生成的结果比UGC难控制,对生成内容进行合规审查是必要的。”叶军称,目前和网信办、工信部以及各地的数据相关部门的沟通在进行中,会根据不同的监管条例和范围做报备或报批。

    最大挑战是商业化

    有意思的是,在发布会现场,叶军希望生成一个“赴汤蹈火”的表情包以显示钉钉智能化的决心,但生成的结果却引起全场大笑,AI根据指令先后“画”出一个燃烧着的笑脸、一张在火中烤的笑脸和一个在沸腾的液体中燃烧的笑脸。

    “真的在火里面烤啊,过于残忍了,再换一个”,叶军调侃道。显然通义大模型生成的表情包还没有达到钉钉理想的效果。在生成文案的演示环节,叶军也不时地调侃,“通义千问还是需要继续学习,现在写出来的跟我的水平差不多……”

    谈及现场演示效果,叶军向南都记者表示,“只能说比一个多月前的好多了。比如AI绘画工具Midjourney4.0版本和5.0的差别也很大,4.0有点粗糙,只能画出四个手指头,通过几个月不断的迭代,用大量图片喂给它,5.0版本就可以画出五个手指,这一个逐渐成熟的过程。”

    之所以冒险采用现场演示的形式发布,叶军表示,对通义千问大模型有足够信心。“不是说它今天多牛,而是它进步速度快,客观来讲还是有些不太靠谱的内容,比如‘车水马龙’这种也会出现,我们原来也很担心,但一两个月下来,它每次给我们一些不一样的结果,总体来说是有自信的。”

    谈及接入通义千问的过程,叶军向南都记者表示, 不同的阶段存在不同的难点和挑战。其中前一个月为共创期,双方主要探索应用在哪些场景,“一开始最大的难点在于方向的不一致,想做的东西不一样,我们两个团队每周开一次会,甚至会吵架。”

    在确定了方向后,双方紧密合作了一个多月来打磨这些场景下的功能,期间的难点在于调参数。“钉钉的场景对通义大模型提了很多特殊的要求,大家知道模型要调参数,参数量越大,模型质量越高,我们提供的对图片的质量要求,对工作场景的专有化术语,它解释不了qq群聊对话生成器在线制作,理解不了,有时候生成出来的东西莫名其妙”,叶军称,这是过去一个月双方反复磨合的地方。

    接下来的难点则在于如何跑通商业化模式。“我们有自信用最好的算力条件来完成用户场景的覆盖,唯一的难点是找到可持续发展之路,以用户认可的方式,以一种合适的模式收回(成本),这是现在我们考虑的问题。”叶军称。

    在收费模式上,叶军表示会参考海外软件的收费模式,和钉钉现有的专业版、专属版和专有版会员结合,如买专业版、专有版配合给200次调用能力,如果不够用,可以继续增购计算量。

    采写:南都记者 马宁宁

    版权声明

    本文仅代表作者观点。
    本文系作者授权发表,未经许可,不得转载。

    发表评论