雷军最近或许有点心烦……
烦什么?你听到了吗?最近,有不少人用雷军的声响进行二次创造,做成各种段子。我听完之后,觉得既搞笑又无法。
比方:
“老子踏*一眨眼,国庆节就过去了,我又得拖着一大堆破行李去上那个X班;假日里,躺在抖音上刷视频的废物们,咱们好,我是雷军,你们千万不要用小米手机看黄片。”
还有更雷人的内容,在哔哩哔哩上,他的AI语音被用来制作各种游戏阐明、论题封面语,比方打篮球、打麻将,主打一个“不爽”,吐槽和谈论十分尖锐。
至于让我感到无法的部分,却不太好描绘。在写这篇文章之前,我把其间一个短视频发给了我爸,并问他:“你觉得这个短视频有什么特别之处吗?”
我爸回答说:“挺有意思的。”但他并没有说到语音的问题,换句话说,他底子没意识到这是AI生成的语音。可见,AI语音现已能够到达以假乱真的境地了。
一
不过,这次假语音和之前“Are you ok?”有很大不同。
Are you ok,内容特点不强,本身没什么歹意,也不会引发误解,最多让自己觉得有点为难;雷军乃至还诙谐地回应过,还把版权买下来,从营销的视点来看,这反而成了一种正面的宣扬。
但AI语音有点不一样。
现在网络上,大部分雷军AI语音,都是网友们用他的声响说的一些很过火的话,什么“长途控制小米手机炸死你”或许“我开小米SU7撞死你全家”。
这些话适当极点。不了解的人,会以为真是雷军说的,现已触及到诽谤的问题。
AI语音有许多种方法,常见的包含:语音组成、语音克隆、语音辨认、深度假造和自然言语处理。前三种咱们比较了解,后两种是最近两年才逐步流行起来的。
深度假造(Deepfake)是由“深度学习”(deep learning)和“假造”(fake)组合而来,意思是用深度学习技能来仿照人的声响和图画。
而自然言语处理(NLP)是让计算机理解和处理人类言语的技能,运用十分广,比方:智能客服和语音帮手。
许多创造者在给视频配音时,为了省时省力又不想出镜,通常会先写好文字,再用AI来朗诵和组成。
拿我来说:一般会挑选港版男普通话、广西表妹或东北话,这样让文本画面和其他地域口音结合,刚好形成了显着的反差感。
这些技能的作用是停留在语音组成和搞笑方面,的确没什么特别的影响;可是,一旦触及到名人 IP 效应再加上搞笑,一同还企图进行文化层面的输出,状况就大不相同了。
由于这不再是单纯的逗乐,还或许引发各种社会反响。
之前关于“三只羊”卢某某的录音想必不少网友刷到过,那段语音听起来十分传神,引起了许多人的评论和忧虑,我听完后都感觉像真的,乃至还在群里吐槽事情本身太推翻三观了。
不过,9天后(2024年9月26日),合肥市公安局很快发布了官方回应,说那是假的,并提示咱们不信谣、不传谣。
假语音威力不比短视频小,短视频有画面,更简略分辩真假,但语音却很难区别,这就更简略误导人们。
二
国外也有相似事情。我用Perplexity查了一下关于AI造假的新闻,发现他们乃至把方针对准了总统,问题上升到了政治层面。
依据《连线》杂志的报导,本年年初,一些新罕布什尔州的选民接到了假充“拜登总统”的自动语音电话,企图误导他们在初选中投票。
白宫新闻秘书承认,电话是假造的,并非总统录音。
美国联邦通讯委员会(FCC)主席杰西卡·罗森沃塞尔(Jessica Rosenworcel)表明,近年来,机器人电话中运用的AI生成语音变得越来越先进,这些语音能够仿照名人、政治提名人,乃至密切家人的声响,然后制作虚伪信息,误导大众。
她着重,假如语音克隆公司在开发运用时触及名人、或许误导大众、传达危险高的内容,应该在传达中加上显着的标识,提示大众留意。“咱们主张,将运用AI生成语音的机器人电话(robocall)视为不合法。”
别的,还有闻名歌手泰勒·斯威夫特的AI假造“不雅观照”在网上疯传,这类AI造假事情引发了人们对人工智能的广泛忧虑。
几天后,造假的人被找到,他坦言自己用AI东西ElevenLabs,仅花了不到20分钟和1美元就完成了造假,是不是很惊人?
本年3月,一位记者发现,只需在上传文件最初参加一分钟的静音,就能够绕过规矩,成功克隆特朗普和拜登的声响,尽管技能能够用来对立技能,但AI检测软件往往无法有用辨认AI生成的音频。
莫非,AI生成语音真的能强壮到这种境地吗?
其实我也有疑虑。自从“三只羊”卢某某AI录音事情后,我一向重视着回应此事的品牌(某声)的开展。
他们的网站上的确有雷军的AI组成声响,咱们能够自己去试听,音色与真人十分挨近,而且发布的数量也不少,这给了许多蹭热度的时机,他们运用名人的声响制作论题。
不只是雷军,现在许多互联网渠道,比方抖音、B站,都有许多与马保国、葛优、“麦克阿瑟(一位仿照网红)”等名人声响相关的视频。
这些视频运用的是AI配音技能,你只需挑选相应的人物声响,然后输入文字,就能生成该人物声响的内容;尽管许多程序会用代称来躲避版权问题,但供给的声响品种多达上百种,还能够调整语速和语调。
图释:某声品牌社区广场,仍能够搜到一些名人音频
到写这篇文章,在(某声)社区人物商场,仍然能够找到雷军、蔡徐坤、卢本伟、刘亦菲、成龙等名人的仿声组成音,你很难分辩是否是真人。
我并不是单单批判某一个软件,而是整个语音生态好像都存在一些问题,这引发了咱们的考虑:
曾经互联网渠道只对图文和视频进行办理,现在进入了AI年代,AI成了一种新前言。
那么,AI作为前言载体做出来的渠道,是不是本身也要自我办理?是不是得要求用户,非自己不能用他人的声响假造?至少现在看来,归于三不管的地带,没有很细节的法律条文、也缺少明晰的社区规矩。
三
已然供给技能的渠道监管不到位,那么,发布渠道就真的无法监测吗?比方,我将AI语音发布到抖音、快手等渠道,莫非它们就无法检测到问题?
问了一圈在行的朋友,他们说,这触及到两方面问题。
从技能视点,语音模型的自动语音辨认(ASR)和文生文、文生图的原理相似,它们首要都要许多的语料来进行练习,只要这样才干生成更多精细化的模型。
这些模型越细分,语音辨认作用就越好。这让我感觉,这像是一个层层递进的套娃游戏。
别的,现在国内干流的ASR技能多选用端到端模型(End-to-End Models)。这种模型经过一个网络,将输入的语音直接转换为输出成果,简化了传统ASR体系中多个杂乱组件的流程。这使得辨认进程愈加高效,但中心环节也减少了。
比方说:当你对着手机说“今天气候怎么样?”,端到端模型能直接将语音转为文字,查询气候信息,并告知你成果,这种方法十分方便,但它不具有中心的感知才能。
尽管现在干流的AI语音模型开端选用更深度的学习结构,如循环神经网络(RNN)、长短时记忆网络(LSTM)和Transformer来处理一些要害部分,但这些技能仍处于前期阶段。
面临一些更杂乱的状况,如方言和多音轨的噪音,模型仍然存在局限性,由于练习数据不行全面,模型才能有限。
从审阅机制来看,问题就更显着了。一位技能朋友说到:
2018年,有一则新闻,今天头条的创始人张一鸣宣布了一封公开信,回应“内在段子”被关停的事情。在信中,他说到为了补偿算法和机器审阅的缺乏,需求加强人工运营和审阅,将6000人的审阅团队扩大到10000人。
相同,快手当年也采取了相似方法,将2000人的审阅团队扩展到5000人。他们都认识到,在“算法是否具有价值观”的问题上,有必要加大投入。
当年视频面临的问题,现在AI语音也遇到了。
渠道审阅机制分为两部分:机器审阅和人工审阅。机器审阅能快速辨认显着违规的内容,但关于隐晦、杂乱的内容,机器或许判别不精确,就要人工审阅。
AI语音的杂乱性不亚于视频,不同语种、口音、语速等都会影响辨认作用。要逐帧处理这些要素,而且应对AI生成的以假乱真的音频,是一项极大的应战。
你想想看,用AI生成一个音频,再让它自己辨认是AI生成的,这种循环无疑是对技能的极大检测。
要想完成“魔法打败魔法”的作用,渠道要投入更多资金和资源,这不只困难,还要时刻;因而,咱们正处在一个技能、道德与监管并行开展的新阶段。
四
一个在大厂作业的朋友告知我,现在传达内容的渠道针对这种“灰度空间”有三种处理方法:
榜首,查看元数据是否有隐性标识。
所谓隐性标识,即音频里用来确认内容的来历或生成的方法,现在,这项技能现已有所开展和运用。
相似于字节跳动早年自研的躲藏水印算法,现在现已运用到各种产品上。本年3月14—15日,我国人工智能工业开展联盟(AIIA)发布了“信元令”数字隐写标识渠道,也在大力推广。
简略来说,他们都在处理同一个问题,即让AIGC生成的内容自带标识,这种标识人看不到,技能却看得到。
第二个方法,提示用户自行增加阐明。
假如渠道未检测到隐性标识,会提示用户自动标明内容来历。你或许也见过在发布内容时,能够挑选标示“取自网络”“AI生成”或“原创拍照”。
用户不想自己声明,也没有隐性标识,那渠道会进行第三种方法:抽样检测。一旦发现语音中有AI的痕迹,就会直接增加提示标识。
了解了这些,你就能理解,为什么有些视频下方会呈现“疑似运用AI生成技能,请留意鉴别”的提示。为什么说是“疑似”呢?由于现在AI还无法彻底精确地辨认另一个AI生成的内容。
不过,有一个条件:除非某个内容真的引发了广泛重视和巨大言论,渠道才会自动干涉。不然,面临海量内容,渠道很难做到逐个审阅。
所以,防备AI语音,不只是个人和企业的职责,更要技能供给商和社会各界一同尽力。
在深度假造众多的年代,雷军成为了国内第二个因AI语音造假而受到影响的人,咱们看看段子就好,千万不要成为传达的始作俑者。
总结
AI正在仿照真人。
我想提示咱们,在网上阅读视频时,要多留一个心眼,最好不要默许一切都是实在的。技能无罪,就怕心怀叵测,期望咱们能明智地运用它,推进社会向活跃的方向开展。
本内容为作者独立观念,不代表虎嗅态度。未经答应不得转载,授权事宜请联络 [email protected]
【时政】中美气候举动作业组建议会顺畅举办为执行中美首脑旧金山接见会面一致,协作应对气候变化,1月12日,中美“21世纪20年代强化气候举动作业组”建议会以视频方法顺畅举办。会议由我国气候变化事务特使解...
近来新京报刊发查询报导《看望|抽一路熏一路,公共场所的“游烟”何时不呛人?》,引发广泛一致。随后连续有读者向本报反映,相较于室外“游烟”,居民楼、写字楼等公共场所与作业场所的二手烟问题相同令人苦恼。近...
北京时间23:00,世界杯1/8决赛摩洛哥vs西班牙!本场竞赛将在教育城体育场进行。摩洛哥首先发布首发,齐耶赫领衔,马兹拉维、阿什拉夫出战。西班牙首发:门将:23-乌奈-西蒙后卫:6-马科斯-略伦特、...
据玉渊谭天音讯,4月17日,应我国贸促会约请,英伟达公司首席执行官黄仁勋抵达北京。
受关税战冲击,黄仁勋紧迫访华。据玉渊谭天音讯,4月17日,应我国贸促会约请,英伟达公司首席执行官黄仁勋抵达北京。黄仁勋本次访华的重要布景,是刚刚被特朗普出口控制新规打了个措手不及。据上海证券报报导,当...
“吴大叔”足蹬高跟鞋
“特殊”视频火爆的背面
在吴楠的视频里,他梳着大背头,戴着黑框眼镜,下颌留一小撮胡子,脚蹬一双赤色高跟鞋,顶风狂奔。奔驰的姿态卖力又有些好笑,因而收成了许多网友的重视。
“我是偶尔间走上穿女鞋拍视频之路的。刚开端这样做,便是为了博重视和流量,更好地卖鞋。”吴楠毫不讳言。
出生于四川自贡的吴楠本年41岁,大学的专业是计算机,结业后他开端创业,现在卖女鞋年营业额好几千万。
170cm、128斤,39码脚,练过体育的吴楠腿部肌肉紧实,这才让他穿上高跟鞋后小腿看起来也毫不违和。他说,人物反串拍视频,是为了更好地了解高跟鞋,然后做出对女人脚部更友爱的高跟鞋。
在直播间,乃至有人惊呼:“这男人穿得比女人还美观,我都对鞋子有点心动了。”
订单的许多涌入,让他的生意走上正轨。吴楠告知记者,成功其实不是一蹴即至的,为了赢得客户口碑,他花了15年,创业之路可谓好事多磨。
大学结业后,吴楠开端从事出售作业,从2008年开端创业,做电商卖女鞋。
“那时也享遭到了电商的榜首波盈利,6个月后每月的流水做到了两三千万,尽管赢利比较薄,但仍是挣钱的。不过后来当订单许多暴增时,由于缺少办理和财政规划才干,许多问题都涌了出来,2012年时,榜首次创业以亏钱草草了事。”吴楠回想道。
不服输的吴楠仍然看好女鞋商场,2013年他来到女鞋较会集的浙江,开端了二次创业。正赶上电商的高速发展期,很快他又做得风生水起,出售额一年就有几千万。
“那时分团队现已达到了100多人,最高峰的时分,在渠道上top10的店肆里,咱们就占了五六家。”吴楠告知记者,这时心态发生了改变,“就想往大了做。”
惋惜的是,在快速扩张的过程中,呈现了许多无法掌控的问题。到了2018年,吴楠从开端赚几百万元到亏本800多万,他的二次创业也黯然收场。
两次创业真实让吴楠备受冲击,在尔后的两年,他什么都没干,感到很苍茫,“彻底找不到方向,不知道自己究竟该做什么。”
直到一次偶尔的时机刷短视频,让他遭到启示,2020年,又开端了三次创业。
为了打破心思防地
他穿戴高跟鞋去了成都太谷里
“一次集会时,有朋友提起,在短视频渠道,有一个男的穿高跟鞋如同点击量很高。”朋友不经意的言语,引起了吴楠的留意,“我的脚是39码,正好穿得下高跟鞋,是否能够穿上高跟鞋博流量营销呢?”
说干就干,但榜首次总不那么简单迈出。
“其实我也没有穿高跟鞋的嗜好,朴实是为了拍视频卖鞋。”说起榜首次穿高跟鞋的体会,吴楠介绍,“疼,走路尽管不至于跌倒,但走不稳。”他每天在作业室穿高跟鞋,花了两周的时刻才做到能够熟练地走路。
每天走进作业室时,吴楠就换上高跟鞋,对着镜子边走边调查,有时还找来女模特穿高跟鞋的视频投放在大屏幕上,跟着她们练。
长时间操练,吴楠总结出了经历,“受力点要从脚跟开端,脚踝要用力,腰要扭起来……”吴楠说,从走起来,到跑起来,他又花了三个月。
一个大男人穿戴女式高跟鞋走到人前,确实是个应战。吴楠说,他也是做了屡次测验,才打破了自己的心思防地。
“从公司走到楼下步行街,都测验了许屡次才敢的,尽管人不多,但老感觉有人在看你,自己也是低着头。”吴楠说,后来为了逼自己打破极限,他还穿戴高跟鞋去了成都市中心富贵的商业区太谷里,“走了三四次,每次大约半个多小时。”就这样,渐渐的,他习气了穿高跟鞋。
在吴楠的作业室里,至今仍存放着一款后跟高达11厘米的赤色高跟鞋。这是他穿过的鞋跟最高的高跟鞋,“很辛苦,没有舒适度可言,只能说是美丽,能够让线条变得更美观,变得更高雅。”
据扬子晚报音讯,在成都邃古里,假如你看到一位藏着一小撮胡子,穿戴高跟鞋奔驰的中年男人,你会作何感触?不要惊奇,他是一位高跟鞋专卖店的店东。最近,他穿戴高跟鞋的“反串”视频火了,全网近400万粉丝被他的...
报导提及,在印控克什米尔区域产生丧命突击后,印度官员23日宣告,内阁会议决定“暂时放置”1960年签署的《印度河水域公约》,直到“巴基斯坦可信且不可逆转地抛弃对跨境恐怖主义的支撑”。这项公约规则了两国对印度河水资源的运用。
印度官员还提到了此次突击的“跨境联络”,但没有具体阐明巴基斯坦涉嫌在其间扮演什么人物。
据“参考音讯”微信大众号音讯,英国《金融时报》网站4月23日报导,巴基斯坦官员23日称,印度政府暂停一项重要的跨境水协议是在发起“水资源战役”。报导提及,在印控克什米尔区域产生丧命突击后,印度官员23...