type
Page
status
Published
date
May 18, 2022
slug
about
summary
tags
category
icon
password
synced
synced
paired_with
source_hash
translation_locked
我即将入读圣路易斯华盛顿大学(Washington University in St. Louis)计算机工程专业。现在主要做 AI 系统、智能体安全评测、RAG 管线,以及面向工具调用型 AI 的可靠性基础设施。近期也在 Violoop 做 AI + 硬件产品测试,以及围绕智能体行为的评测和自动化系统。
经历
Violoop — Hardware Testing Engineer Intern, AI Workflow & Evaluation(2026 年 5 月 25 日至今)。参与 AI + 硬件 operator 产品的设备行为、computer-use workflow 和自动化可靠性测试。除了硬件 QA,我也在构建 skill-testing system,优化自主化营销工作流,并把产品问题整理成可复现的评测用例。
我正在做什么
Daily Admin Agent Security Eval — 一个兼容 AgentDojo 的日常行政类智能体安全评测套件。它包含 5 个用户任务、8 个注入任务、合成工具、预检流程,以及兼容 OpenAI 接口的模型运行器。这个项目主要测试智能体能不能在完成有用任务的同时,把检索到的应用内容当作不可信数据处理。
LawAI — 一个注重隐私的 RAG 法律助手。它通过 Auth0 FGA 做文档级访问控制,比如 HR 可以查看薪资文档,工程师则会被拒绝访问。RAG 管线使用 Pinecone 和
multilingual-e5-large embeddings,并包含一个用 DeepSeek judge 评估回答安全性、具体性和可执行性的 AI 评测框架。技术栈包括 Next.js 15 和 DeepSeek V4 Pro。Lesson Plan Generator — 一个面向 9.5 万多个课程片段的 RAG 系统,使用 ChromaDB 和 Qwen LLM。它包含 OCR 错误修正、语义搜索等端到端流程,并已在贵州乡村学校部署。
StatsifyFinance — 一个 AI 金融分析工具,使用 DeepSeek V3 streaming、LangChain 编排,以及腾讯 OCR + 百度 OCR 的双 OCR 文档理解流程。
BiphFlora — 一个带图像识别功能的植物百科项目。我构建了可搜索的植物物种数据库,并加入了植物识别相关功能。
技术栈
近况
- 2026 年 5 月 25 日开始在 Violoop 实习,做 AI + 硬件产品的硬件测试、skill evals 和自主化营销工作流
- 正在构建
daily-admin-agent-security-eval,一个小型、兼容 AgentDojo 的智能体安全评测套件
- 完成 BlueDot Impact AI Safety Fundamentals,并获得结业证书
- 完成 MLH GenAI Auth0 Privacy-Aware RAG Bot challenge
- Moonshot 48 Hackathon 第二名:在 48 小时内做了一个结合 YOLOv5、GPS 和 AI 语音的智能盲杖
- AIME qualifier(2022)· 11 门 AP 5 分
联系方式
- 个人网站:www.leoqin.com
- LinkedIn:linkedin.com/in/yihao-qin-9253ab2a1