收到四五百份应聘素材

  目前还没选出合适的

  阿里巴巴公关经理朱女士确认了这份招聘的真实性,“是为了录制用于天猫精灵智能音箱的语音合成素材,采集四川话的成都口音。”她看了下邮箱后说,上周四前后招聘发布,现在邮箱里已收到四五百份应聘的素材。不过她表示,自己跟着听了几十份,“还没有符合条件的。”在她耳朵里,这些声音的音质自不必说,只是在稳定性方面或在创造性上都有所欠缺。

  “收到的邮件里,有一些是专业的配音公司发来的。”朱女士介绍,除了发音标准、音质稳定,考虑到天猫精灵智能音箱的用户人群,声音还得年轻、活泼,“所以我们更加倾向于学生。”她也解释了“创造性发挥”:实际使用中智能音箱和使用者交流时,是有性格的,有时候会是幽默的,有时候可以怼,有时又要可爱,因而应聘者在录音时并不总是阅读固定文本,“例如,我们会给出一个问题,要求给出十个不同的回答。”她介绍,2分钟的自我介绍就有意考察应聘者的发挥。

  至于外语要求,她举例:使用者要听英语歌曲时,说出后智能音箱会复述,“需要保持汉语和英语音质的一致性,所以要求应聘者会说英文。”

  在她看来,时薪700元的工资,在语音合成行业里已不算低,“一般是400-600元。”给出高薪是考虑到方言的语音合成相对于普通话要难。不过一天挣5600元的想法不太现实,“一般一天会录4个小时,如果录8个小时,可能接下来要休息一周。”朱女士补充,这次招聘是根据实际录音时间计薪的。

  四川话和普通话差异小

  目前只在做四川话版本

  “如果确实有与要求相符的声音,最终会选定一人。“朱女士介绍,之后便由供应商安排选中的人录音,做语音合成,并提供给阿里巴巴方面。标贝(北京)科技有限公司便是这个项目的供应商。她解释,使用时智能音箱会说很多不同的话,录音时不可能全部顾及,“会把有可能出现的字、词和连贯的句子录下来,供应商再做语音合成——这样,就会自动生成各种各样的话。”

  据介绍,目前天猫精灵的方言版本只有四川话。“四川话覆盖的人群广泛,能够和我们一起做这件事的人就多。”另一方面,朱女士表示,四川话和普通话的差异相对小一些。“智能音箱还涉及到语音识别,需要理解方言在普通话里的意思,四川话几乎不存在这个障碍。”

  “肯定不会只有四川方言。”她也透露,不过目前还没想好其他地区的方言版怎么做。

  成都商报-红星新闻记者 彭亮