技能鉴定
招聘广告中的技能通常用不同的术语来表达,使得简单的基于字典的识别变得复杂且容易出错。需要更可靠的方法来识别大量招聘广告中的技能。在图 1 中,我们概述了技能识别文献中使用的方法以及招聘广告背景下技能识别的各个组成部分。在可扩展性方面,基于 ML 的方法仍然是最实用的替代方法,例如基于深度学习的命名实体识别 (NER)。
图 1:在线招聘广告的技能识别框架
NER 是在给定文本中识别和标记实体的计算机化程序。NER 也称为(命名)实体识别、实体分块和实体提取。它是信息提取的一个子任务,旨在将非结构化文本中提到的命名实体定位和分类到预定义的类别中,例如人名、组织、位置、医疗代码、时间表达式、数量、货币价值、百分比等。在技能识别上下文,典型的实体是招聘广告中引用的不同技能。这些深度学习模型允许通过解析招聘广告文本来检测技能。