今年,BOSS 直聘以一篇名为《Interview Choice Reveals Your Preference on the Market: To ImproveJob-Resume Matching through Profiling Memories》的论文成功入选会议科研类论文单元,今年此单元论文录取率仅为14%。
在这份论文中,BOSS直聘提出针对求职者与招聘者双方偏好进行建模的新型匹配模型,此模型能有效地提升求职者与招聘者的匹配效率。

为此,我们采访了本篇论文的作者之一,来自BOSS直聘NLP中央的宋洋博士,聊了本次论文对付现实招聘场景的代价,以及BOSS直聘在干系领域的方案。

在BOSS直聘NLP中央卖力人宋洋博士看来,招聘场景里无论是求职者还是招聘者,在提交了一份简历或职位描述时,都认为这已经能够非常清楚表达自己的实际需求,然而事实上,静态文本无法充分表达你内心最深层的需求。

“其一,你写的东西不一定充分代表你的需求。
很多时候岗位文本表述的信息,与实际所需求的特色不相匹配。
”宋洋博士进一步补充道,“这也是很多时候导致匹配效果变差的缘故原由,由于大家没有办法很好的去表达自己真正想要的东西,以是在这篇论文中,我们加入了动态交互行为的文本偏好信息来赞助系统进行更高效的匹配。

BOSS 直聘宋洋博士AI 可以帮你理清自己最深层的求职/招聘需求  KDD 2019

目前确当务之急,是要不断基于静态文本、动态行为、以及更多丰富的场景数据资源来收敛双边的需求。
“我们须要不断地收敛需求,这是系统匹配变得高效的条件。
”宋洋博士如此说道。

用户过往的求职招聘行为表示了个人偏好

在过去,传统的双边推举系统紧张基于人工构建的特色,通过演习模型来拟合是否匹配。
近几年随着深度学习的发展,才开始涌现基于深度匹配模型来学习简历文本与职位描述文本是否匹配的事情。

宋洋博士先容道,BOSS直聘本次的事情相称于过往事情的延伸。
“我们认为,求职招聘场景除了简历文本和职业描述的静态文本信息外,还包括双方曾经产生的交互行为——求职者口试过的岗位,以及干系岗位过往口试的候选人。

宋洋博士表示,用户过往的应聘经历表示了个人偏好,而这些偏好又会影响用户后续的决策,包括点击或沟通哪些职位、是否匆匆成口试等行为。
为此,BOSS直聘团队提出了一个全新模型,通过在职位侧和简历侧两端分别引入影象模块学习包含交互行为的文本偏好表示,接着基于影象模块迭代职位和简历的文本向量表示,终极通过一个多层感知器来拟合是否匹配。

本文提出的模型由招聘者与求职者双边对称的表示学习网络,以及匹配网络三部分组成。
在岗位描述表示学习网络中,模型利用岗位描述文档以及该岗位历史上曾经口试过的求职者的简历文档,通过引入影象模块来打算带有偏好的岗位向量表示。
对称地,可以得到带有偏好信息的简历文档表示。
以上述两个文档表示为输入,模型利用MLP网络打算匹配分数。
优化的目标是极大化发生口试的岗位描述与简历文档之间的得分,极小化不匹配样本对之间的得分。

将“用户历史交互行为”加入全体推举匹配模型是本论文最大的创新点,以岗位描述文档结合“历史交互行为”的文本表示为例,紧张分为初始化阶段和影象模块迭代两个处理阶段:

初始化阶段:

模型首先对岗位描述文档里的各个句子,以及该岗位历史口试过求职者的简历文档内的各个句子经由层级GRU网络进行编码,得到各个带有高下文信息的句子表示。

同时,模型将岗位文档各个句子带有高下文信息的句子表示作为影象模块的初始化。

影象模块迭代:

给定一个岗位描述文档J按照韶光顺序遍历与该岗位发生过口试的简历文档R,对影象模块M进行更新与读取的迭代:

a)利用J和各个R对M进行更新(影象模块更新)。

b)J从M中读取偏好信息(影象模块读取)。

终极,团队基于BOSS直聘真实场景数据集进行的实验结果显示,该方法优于传统的机器学习方法以及其他基于深度文本匹配的方法。

宋洋博士先容,未来该论文提出的模型将会被利用到BOSS直聘的线上搜索推举系统提高推举匹配效率。
“ 核心还是在于提高推举的匹配效率,以节约招聘者以及求职者的韶光本钱。

与北大互助机缘

谈到本次研究的初衷,宋洋博士表示,近年来,以BAT为代表的海内互联网公司频频在国际顶会上揭橥论文 ,在企业技能取得进步的同时,也为学术界做出了相应贡献。
他进一步表示,求职招聘场景一贯以来都未得到工业界与学术界的重视,作为海内大型互联网招聘公司之一,宋洋博士认为BOSS直聘有任务推进该领域的研究事情,以引起更多同行的关注,共同推动招聘行业的发展。

为何互助单位选择了北大?宋洋博士与北大严睿老师曾是同学,两人在谈天时会常常聊到双边匹配的可能性,以是一拍即合,终极匆匆本钱次互助。
“过往学界在推进干系研究时,更多集中于单边推举系统,而求职招聘场景是天然双边匹配推举场景,拥有广泛的文本数据资源,如简历/招聘描述、双方交互行为等。
”宋洋博士如此说道。

据理解,为了更好地推进该事情,双方团队一起碰撞了四个多月。
终极,将成果投稿于KDD大会,卖力评审论文的三位评委肯定了该事情的创新性。

“BOSS直聘是第一个提出将静态的文本信息与动态的行为交互偏好信息结合到一个深度文本匹配框架下,用于办理求职招聘场景的双边推举匹配问题。
”宋洋博士补充道,“问题的办理思路足够直不雅观、实验部分比较踏实充分、实验效果也很好,这些都是加分项。

此外,宋洋博士认为还有一个潜在的缘故原由。
“由于求职招聘目前尚属于小众的问题领域,对付看了特殊多电商推举、图网络方面论文的评审来说,看到双边匹配推举模型运用于人力资源行业,让人面前一亮。

BOSS 直聘 NLP 中央

BOSS直聘NLP中央成立于2017年7月,紧张职能是面向BOSS直聘全场景的文本数据资源开展根本算法研究以及运用做事开拓。

根据 AI 开拓者理解,该中央卖力研究求职期望文本信息与岗位描述文本信息之间的双边匹配算法,比如求职期望解析、职位描述的构造化信息提取、双方交互行为信息挖掘、知识图谱、智能客服等等。

宋洋博士表示,除了与NLP干系的事情外,中央还会涉及图像算法以及安全风控方面的事情。
未来,BOSS直聘NLP中央将连续环绕求职招聘的场景,聚焦于迁移学习、异构信息网络推举等多个方向做更深入的探索实践。
在本次采访中,宋洋博士也对这两个方向的研究做了详细先容:

迁移学习试图办理的是部分岗位求职者信息不敷所导致匹配效率低的问题,通过将某个文本信息更加丰富的岗位/行业场景迁移到文本信息相对匮乏的岗位/行业场景,提高双边匹配推举效率。

异构信息网络推举是近几年在推举算法领域比较前沿的研究方向,以是希望能沿着该方向做一些探索实践。

宋洋博士见告 AI 开拓者,BOSS直聘NLP中央将近40人,目前团队在NLP算法、图像算法、安全风控算法、知识图谱、智能客服、图数据库等方面都有招人需求,对此感兴趣的同学,可以密切保持关注。

在问及有何建议给到年轻的 AI 开拓者们,宋洋博士表示,“只管即便多做一些与工业界实际业务场景干系的核心问题,才能做出更多具有工业代价的贡献。

封面图来源:https://www.enago.cn/academy/tips-on-writing-a-resume-for-an-industrial-research-job/

雷锋网 AI 开拓者雷锋网