本技术涉及一种多语言文本中的实体语义识别技术、系统及相应的存储介质。该技术依据不同单词及其在不同语言中的音素长度差异,记录音素的不同组合方式及其对应关系,实现跨语言的实体语义识别。
背景技术
跨语音文本识别(Cross-lingual Speech-to-Text, CLS2T)是一种技术,它可以将不同语言的语音转换成对应的文本。
这项技术的目标是实现在不同语言之间进行语音转写和翻译的功能。
跨语音文本识别技术通常包括以下几个步骤:语音识别:将语音信号转换为文本。
这一步骤使用的是语音识别技术,通过对语音信号进行分析和模型匹配,将其转换为对应的文本。
语言识别:确定输入语音的语种。
由于跨语音文本识别需要处理不同语言的音,因此在进行语音识别之前,需要先确定输入语音的语种。
翻译:将识别出的文本进行翻译。
这一步骤使用的是机器翻译技术,将识别出的文本从一种语言翻译成另一种语言。
但是经常需要先输入语言类别在对齐进行检测。
而在一串语音夹杂多种语言类别且未知每个单词对应的语言类别时,检测较为困难。
例如,在进行交互时,用户用中英文交杂进行交流,如 “你好!我想去hospital,怎么 to go?”对于这样夹杂多种语言的场景,同一个音素能表示中文,也能表示英文,如“togo”也能被识别为汉字“tugou”难以对语言进行翻译准确的翻译。
实现思路