[社招杭州] AI Agent 算法工程师(数据采集与内容智能方向) - BAT 安全团队

4 月 7 日
 moon1light
岗位名称
算法 Agent 工程师(数据采集与内容智能方向)

工作内容
面向公开媒体数据采集场景,建设页面理解、正文抽取、字段标准化、内容去重归一等核心算法能力。
负责文本分类、实体识别、属性/关系抽取、相似度计算、结构化建模等内容理解任务。
参与检索召回与相关性优化,建设关键词检索、语义检索、混合召回、实体级召回等能力。
基于规则、模型、LLM 和 Agent 工作流,提升采集链路的自适应处理能力与复杂任务自动化水平。
建立评测集、质量指标和 badcase 迭代机制,持续优化抽取、召回和数据质量效果。
推动算法能力在采集平台、内容处理平台和数据服务中的工程化落地。

我们希望你具备
扎实的 NLP/机器学习基础,熟悉分类、序列标注、抽取、匹配、聚类等任务。
熟悉 Python/java ,有良好的工程实现能力。
有信息抽取、检索召回、内容理解或数据结构化相关项目经验。
了解大模型应用,具备结构化抽取、RAG 、Tool Use 或 Agent 工作流实践经验。
了解网页采集和页面结构解析基本原理。
具备评测、优化和持续迭代意识。

加分项
搜索/知识图谱/媒体内容理解相关经验
OCR/ASR/多模态文本处理经验
Embedding / Rerank / ES / 向量检索经验
规则+模型+LLM 混合方案设计经验



绿泡泡:wxid_xw0qqs5o9t1c22

email:amp1X2NhbWlsZUAxNjMuY29t
1395 次点击
所在节点    酷工作
2 条回复
CodeDaiQin
4 月 7 日
有其他机会吗
moon1light
4 月 9 日
@CodeDaiQin 暂时只帮发了这条 其他哪个方向的?我可以去翻翻

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://v2ex.xtra.eu.org/t/1204137

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX