|
Post by account_disabled on Mar 4, 2024 5:59:42 GMT
这些 NLP 工具中最有用的是命名实体识别 (NER) 技术。与更简单的 NLP 技术不同,NER 是一种监督学习模型:在使用 NER 模型之前,您必须首先使用预定义实体类别的数据集对其进行训练。这种高度可定制的训练赋予了 NER 力量,因为您可以预先定义要提取的信息。 什么是命名实体识别(NER)? NER,也称为实体分块或实体提取,是一种 NLP 技术,可扫描文本数据以识别和分类预定义的命名实体。
该过程从原始数据中提取结构化 电子邮件数据 数据(实体)。然后可以分析这些结构化数据以获得见解并应用于众多业务用例。 什么是命名实体? 命名实体是每个陈述或句子中的基本信息,例如: 名称 人们 组织机构 地点 产品 时间单位 日期 时代 数字 测量 距离 金钱/定价 数量 命名实体是 NER 模型灵活性的关键:因为它们可以是您选择的任何内容,所以您能够训练模型以提取特定用例所需的准确信息。 NER 是如何运作的?
考虑一下阅读时会发生什么:当您的眼睛扫描单词时,您会自动识别任何命名实体。例如,当您阅读“ 2022 年 10 月 27 日,Wendy 离开梦幻岛并开始担任 Lost Boys Inc. 首席执行官的新职位”这句话时,您可能会认出以下命名实体: 日期:2022年6月27日 人物:温迪 地点:梦幻岛 职业:首席执行官 组织:迷失男孩公司 另一方面,机器使用二进制语言 (0, 1)。而0和1与人类语言的丰富性和深度相去甚远。
|
|