本公开实施例公开了一种基于自然语言处理的词云创作方法、装置、介质、产品。其中,方法包括:对文本进行预处理,获得多个有效词语;获取所述有效词语在所述文本中的出现频率;对所述有效词语进行情感分析,获得所述有效词语的情感评分;获取所述有效词语与所述文本的主题的相关度;基于所述出现频率、所述情感评分、所述相关度在所述有效词语中筛选出关键词;基于所述关键词生成词云。该方法能够通过结合出现频率、情感评分和相关度,生成有效反映文本内容的要点、情感倾向和主题的词云,提升了词云的可解释性,使得观众更容易理解和吸收文本信息。
背景技术
词云是一种流行的数据可视化技术,通过“关键词云层”或“关键词渲染”的视觉图形对文本进行表示,用于展示文本的关键信息,通常情况下,词云中最明显的词也就是文本中最重要的关键词。传统的词云生成工具通常需要用户手动输入文本并设置参数,这在处理大量文本数据时显得繁琐且效率低下。此外,这些工具通常仅采用TF-IDF技术来获取关键词,情感分析和主题识别方面的能力有限,导致最终获取的关键词可能不具有代表性,不能很好地反映文本的观点。
实现思路