neurocomputing

命名实体识别产品名的方法?

  •  
  •   neurocomputing · Jan 25, 2017 · 7863 views
    This topic created in 3425 days ago, the information mentioned may be changed or developed.

    如题,对于产品名有什么好的命名实体识别算法?

    如:

    “提到安卓系统的车机手机互联方案,可能你首先想到的就是谷歌的 Android Auto ,当然,还有百度家的 CarLife 、乐视的 ecolink 以及 MirrorLink 等,但是在全球范围内能和 CarPlay 一战的,恐怕只有 Android Auto 了,基于谷歌强大的生态系统, Android Auto 在使用体验和功能上并不比 CarPlay 差,而且,苹果和谷歌在车载领域的竞争,也能从这两个系统里面直接看出”

    Android Auto , CarLife , ecolink , MirrorLink 应该被识别出来

    再如:

    “从 9 月 6 日开始,细心地用户应该能发现,滴滴打车 APP 的启动界面有了变化,此前的“滴滴打车,再见”的载入界面已经消失,取而代之的是“滴滴打车全新品牌升级倒计时”字样。根据滴滴内部人士透露,此番动作并不像外界猜测的那样涉及多项业务调整,而只是将更换品牌名称,从“滴滴打车”改变为“滴滴出行”。滴滴将不再只是打车,而是要做移动出行的综合性入口。”

    滴滴打车,滴滴出行 应该被识别出来

    发现目前开源的 NLP 库都无法进行产品名的命名实体识别, bosonnlp 有这项服务,准确度也还可以 但是究竟是什么样的算法呢?

    1 replies    2017-07-05 08:52:17 +08:00
    zix
        1
    zix  
       Jul 5, 2017
    暴力的办法:用检索或自动机的办法,自己收集好大量的产品名,直接匹配。

    模型的方法:收集你要处理的实际场景里带产品名的文本(人工标注,或者上述匹配方法的日志数据),上序列标注模型,LSTM+CRF。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1692 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 16:18 · PVG 00:18 · LAX 09:18 · JFK 12:18
    ♥ Do have faith in what you're doing.