海峡人民日报

首頁+設為主頁+加入收藏+RSS訂閱+ 繁体中文+ 線上記者名單

人物專訪

Speaker语音链是全球领先的“区块链+大数据”垂直落地应用

\
【本報人物專訪】
Vivian Zhou,Speaker语音链创始人。毕业于国内最顶尖的语言大学北京外国语大学,曾任职佰职科技的高级合伙人。佰职科技专注于AI自然语言处理和招聘大数据采集,在业内处于领先地位。

Speaker语音链是全球领先的“区块链+大数据”垂直落地应用。Speaker语音链致力于运用区块链技术构建去中心化语音大数据生态,极大提高语音数据采集与处理的效率,同时大幅度削减数据采购与使用成本,高效率解决AI语音识别产业数据瓶颈的痛点。
具体来说,语音链是基于区块链去中心化的共识协作,完成语音数据的采集与处理。对于语音数据来说,最重要的两个环节,一个是语音数据采集,一个是语音数据标注。比如,在语音链上基于工作量证明机制,每个成员可以通过朗读上传贡献个人语音数据,而每一条语音均可获得token回报;此外,成员还可以通过听音频,进行语音翻译转写,获得token,也就是语音数据标注的过程。语音数据贡献者与数据需求方,在语音链上实现点对点互联,数据需求方支付token可以获得数据的使用权。
总之,语音链实现将个人数据价值将通过智能合约,进行可追溯、公平、安全的分布式大数据生态中发挥到最大。同时,也将打破传统的中心化公司对大数据的垄断状态,用户语音数据价值最终回归用户所有。实现人人贡献数据,人人使用数据,人人共享价值的愿景。

大数据和区块链作为近年来的风口技术,一直受到投资者的高度关注。语音链作为一个全球知名的语音数据采集及处理的区块链项目,理所当然地吸引了人们的目光。对此,本報邀请Speaker语音链Vivian Zhou进行独家专访,以下是专访内容。
記者:請問您如何想到要做Speaker语音链
Vivian其实我们的愿景是借助区块链技术实现让人类个人的语音价值被最大化,而且回归到个人。实际上,语音数据其中最主要和最有价值的应用方向之一,是把我们生态中的语音数据应用到AI语音识别领域,促进AI技术商业应用的飞速发展。当然语音识别技术本身的应用场景就有实时翻译,然而这种实时翻译就非常需要大量的语音数据进行训练,才能真正达到优化和提升算法准确率的目的,到未来AI大发展的时代。

記者:你提到语音数据是有价值的,那么语音链的出现又意味着什么呢?
Vivian对于我们的社区用户来说,语音链解决了个人语音价值变现难的问题。每个人带有不同方言口音、不同母语语言等的语音数据,都天然具有价值。在过去中心化时代,个人数据体量太小是难以直接变现的。很多个体的数据,是被科技巨头公司在不告知用户的情况下,进行采集的,比如苹果的语音助手siri,亚马逊的音响Echo,都是在用户使用的过程中进行数据收集,但是中心化公司并未对数据的贡献者——也就是我们每个人,进行价值回报。另一方面,对数据需求方来说,语音链极大提高语音数据采集与处理的效率,同时大幅度削减数据采购与使用成本,高效率解决AI语音识别产业数据瓶颈的痛点。

記者:我看过语音链的白皮书,用现在流行的话来说,我们可以认为语音链使用的是“发声即挖矿”的机制,但是我们该如何确认用户发的声是有价值的呢?大批量收集这些语音数据的用处在哪儿?
Vivian回答这个问题,先要解释两个概念,声音的价值和声音的质量。二者的关系是,声音的质量是声音价值的基础。
对于声音的质量把控与处理,语音链采用混合共识机制,生态的关键节点将负责进行数据审核、数据处理、数据确权、数据存储等围绕着数据的多重相关工作。比如我们的数据存储,将数据以碎片形式,进行全网分布式存储,由链上的节点进行维护。
声音的价值又是如何确保:首先,用户会根据我们的客户端提供的语料,进行语音数据的贡献。其次,数据本身是市场所匮乏、稀缺的。举个例子,带有各地方言口音的普通话语音数据对车载语音系统的训练非常有价值;或者在不同噪声环境下的语音数据,比如开着室内空调的情况下的人声数据,对于智能家居产品语音识别算法的优化,非常关键。事实上,大量企业和研究机构都面临着多语言语种数据匮乏、方言口音数据匮乏、数据样本量有限的“数据荒”问题。
举个例子,我们的技术顾问有来自百度语音实验室的研究员。当初给Oppo设计语音识别系统的时候,参与我们项目的声音数据提供者都是来自北方地区的用户。当时算法识别率在90%以上。然而交接后发现OPPO的用户很多来自南方,一下子识别率就降低了一半。前百度首席科学家吴恩达曾说,“语音识别才是一项资本密集型业务。没有多少组织拥有如此庞大的数据。”语音链解决了对于AI行业来说的高昂数据成本问题。

記者:谈谈你们的项目吧,现在你们语音链的技术团队是谁在负责?
Vivian我们的团队来自海内外名校,包括西班牙马德里理工大学、英国伦敦学院、香港科技大学、北京邮电大学、北京外国语大学、中科院等。我们的技术团队和技术顾问,来自AI语音识别领域、大数据领域。其中我们的张博士毕业于北京邮电大学通信与信息系统专业,获得工学博士学位。也曾任职于北京邮电大学网络与交换重点实验室,主要研究方向为云计算、大数据。还有刘辉,他是以太坊分叉项目EMO的创始人,也是我们项目的顾问指导。
声音的价值又是如何确保:首先,用户会根据我们的客户端提供的语料,进行语音数据的贡献。其次,数据本身是市场所匮乏、稀缺的。举个例子,带有各地方言口音的普通话语音数据对车载语音系统的训练非常有价值;或者在不同噪声环境下的语音数据,比如开着室内空调的情况下的人声数据,对于智能家居产品语音识别算法的优化,非常关键。事实上,大量企业和研究机构都面临着多语言语种数据匮乏、方言口音数据匮乏、数据样本量有限的“数据荒”问题。
举个例子,我们的技术顾问有来自百度语音实验室的研究员。当初给Oppo设计语音识别系统的时候,参与我们项目的声音数据提供者都是来自北方地区的用户。当时算法识别率在90%以上。然而交接后发现OPPO的用户很多来自南方,一下子识别率就降低了一半。前百度首席科学家吴恩达曾说,“语音识别才是一项资本密集型业务。没有多少组织拥有如此庞大的数据。”语音链解决了对于AI行业来说的高昂数据成本问题。

記者:谈起区块链项目,你怎么看待市面上ICO割韭菜的行为? 
Vivian目前整个环境是很浮躁的,ICO割韭菜项目方跑路,这些行为其实是在破坏整个行业的生态。但是历史告诉我们,每一次新技术的到来,总是先伴随着泡沫,互联网如此,移动互联网也如此。对于区块链技术来说,代币是重要的一环,代币解决价值流转的问题。没有代币的区块链是被阉割的区块链。和一般的空气币不同,我们的代币背后就是数据的价值。我相信随着政府对数字货币市场和区块链行业的立法逐渐完善,监管机制逐渐成熟,打破劣币驱逐良币的循环,整个行业是会向着落地、更有价值的方向发展。

記者:最后一个问题就交给你,有什么想跟大家说的?
Vivian区块链技术本质上解决的是信任问题,区块链技术需要与我们过去已有的技术、行业相结合,如果这种结合能够实现:效率的提升与成本的降低,以及促进价值的流转,甚至重新定义其商业模式。这才是真正的落地与价值创造。