📄 cv.md · 仅本机
已刷新
CV — 黄谦敏 (Huang Qianmin)
所在地: 佛山(可接受广州 1-1.5h 通勤)
邮箱: hqm@job.local
LinkedIn: (待补)
GitHub: (待补)
作品集: https://arch.intelab.cn
---
职业摘要 (Professional Summary)
10 年数据经验的数据架构师,前 5 年 BI/数仓,后 5 年专注数据治理。2023 年起在银行场景落地 LLM 数据治理,完成 80 万表级血缘 + AI 评审数据资源目录,为该领域早期落地团队之一。持 DAMA CDGP 高级 + CDGA 工程师双证,主导过广发银行全行级数据治理与 DCMM 二级评估 20+ 家。熟悉银行应用架构资产平台三级颗粒度管理(分层/分组/应用)。
求职方向:数据架构师 / 数据治理专家 / 主数据治理专家 / AI 数据产品专家(广佛甲方银行 > AI 企业)
---
工作经历 (Work Experience)
深圳市赢时胜信息技术股份有限公司 — 服务广发银行
数据架构师 | 2023.05 - 2026.05(广发累计 3.7 年的第二段,3 年)
驻场广发银行研发中心,深度参与行级数据治理。前 8 个月(2023.05-2024.01)任数据地图平台项目经理,带 8 人团队;后续 2.5 年并入数据架构处作为核心成员落地 LLM 数据治理。
主要职责:研发中心数据血缘、数据标准、数据质量、数据架构、数据资源目录的方案设计、规范制定及落地执行工作,探索 AI 技术在数据治理语境下的可能性,推动全行数据治理体系化建设。
做的主要几件事:
① AI 数据血缘项目 (LLM 增强, 2024-2025, 1 年)
- 背景:传统血缘解析工具在跨系统场景覆盖率不到 30%,异构数据源适配性差
- 做法:深度参与 AI 数据血缘方案的 POC 验证、系统设计及落地推广;构建并打通 AI 数据血缘的"输入-加工-存储-展现-反馈"闭环
- 结果:完成大数据平台 100+ 应用的血缘解析模式切换,AI 生成 80 万表级数据血缘,抽样准确率约 97%
② 主数据标准优化项目 (3 年, 核心成果)
- 主导数据标准体系及贯标方案的优化工作,用 LLM 跑了一遍 16 万条标准,识别出重复和过期项
- 字段级数据标准 从 16 万收敛到 9 万 (-43%),推动银行核心、信用卡核心、ECIF 等约 10 个重点应用优先建立数据标准
- 贯标培训约 20 场,覆盖技术骨干约 200 人次
③ 监管报送质量专项 (银行核心交易链路 IP/MAC 缺失治理, 2024-2025, 1 年)
- 应对"网上交易"监管定义模糊:国家金融监督管理总局 + 人民银行,监管未明示"网上交易"边界,行业普遍场景;广发对"网上交易"解释偏窄,银行核心日均 50 万笔交易 IP/MAC 空值率约 50%
- 架构决策 + 三层分工:设计"渠道码值在交易报文头中传递 + 银行核心翻译"轻量机制(合规部起草"广发版'网上交易渠道标准'",我方负责架构 + 集成),把"逐系统改造"变为"一次翻译 + 全行生效"
- 分期交付 + 结果:一期完成 5 个实时交易系统 + 第三方支付(微信 / 支付宝 / 银联不传 MAC 难点已攻克);二期立项 3 个内部批量系统(大额支付 / 同城票据 / 跨行清算,批次处理难点);空值率 下降 50%(50% → 25%) + 月度自动监控持续保障
④ 数据架构规范编制及落地 (贯穿 3 年)
- 从 0 到 1 构建数据架构蓝图,统一全行数据分类主题,明确数据分布及数据流定义,统一数据模型设计规范
- 将数据架构管控嵌入系统设计评审环节,实现架构合规事前管控
- 年均评审重大数据类项目 20 余项,影响项目研发预算超 千万元
⑤ AI 评审全行数据资源目录 (2024-2025, 1 年)
- 利用 AI 技术对全行数据资源目录进行自动化质量评价,通过批量解析生成 200 余项改进建议
- 覆盖约 200 个四级目录 及 2000 余个业务实体与属性 的描述,生成 200 余项改进建议
- 累计释放架构师人力约 60 人天,显著提升数据资产盘点效率与定义规范性
---
广电计量检测集团股份有限公司
DCMM 评估师 / 培训讲师 | 2022.06 - 2023.05(1 年)
- 1 年完成 DCMM 二级评估 20+ 家客户,覆盖客户类型:上市集团 3 家、央企 8 家、地方国企 9 家
- 覆盖制造、通信、消费 3 个行业。每家走标准宣贯、差距分析、能力提升、报告撰写、专家评审全流程
- 典型客户:某新能源汽车头部企业 DCMM 二级评估(2 个月 / 5 大能力域 / 30+ 整改项);中部省份国有通信集团二级评估(3 个月)
- 培训课程包括 DAMA-DMBOK2 五大职能 + 10 大环境要素全套方法论、DCMM 二级评估 5 大能力域实操要点
---
上海中软华腾信息技术有限公司 — 服务广发银行
数据治理项目经理 | 2021.10 - 2022.06(8 个月,广发累计 3.7 年的第一段)
- 主要交付:① 把元数据管理 + 数据资产登记写进研发 SOP,从"被动登记"变"主动必填"
- ② 清理生命周期外数据 — 盘点冷数据、制定保留策略、推动审批,清掉 500T 冷存储
- 直接为行内存储成本每年节省 6 位数
---
独立作品 (Independent Projects)
架构平台 arch.intelab.cn — AI 数据治理工具化实践
Owner / 设计者 / 主力开发者 | 2026.05 - 至今(离职后独立作品)
- 公网 SaaS 已上线 1 个月,面向个人开发者 + 1 个 AI 数据项目试点
- 公网地址:https://arch.intelab.cn (HTTPS 已部署)
- 设计灵感来自广发银行应用架构平台 — 按"分层 → 分组 → 应用"三级颗粒度对全行 IT 资产进行统一登记和管理
- 技术栈:FastAPI + SQLite + Python + Docker + GitHub Actions + nginx + certbot
- 核心产出:FastAPI 后端 15 endpoints(40 pytest 全过)+ CLI 12 子命令 + Web UI 8 页面 + 14 组件已登记 + 3 个跨项目可复用 GitHub Action
- 方法论贡献:不只做数据治理,还做"治理治理本身"的工具
AI 边界探索系列 — 离职后的 4 个 AI SDLC 实验
设计者 / 需求定义者 | 2026.05 - 2026.07(离职后 1.5 个月,方法论探索)
围绕 "AI 在 SDLC 各阶段的能力边界" 这一核心问题,设计了 4 个不同维度的实验(均已落地/复盘):
1. AI Coding 边界 — 育儿 APP 自动开发: 用 AI 写一个完整安卓端 APP。收获:AI 在编码阶段表现良好,但在端到端测试(尤其是安卓设备兼容性)上力不从心,结果无法直接使用。认知**:AI coding 的真实瓶颈不是写代码,而是测代码。
2. 多 AI Agent 生产存在实验 — 虚拟小镇: 让多个 AI Agent 在虚拟小镇里"生活",有持续状态、决策、互动。收获:框架跑通,验证了 AI 不只是开发工具,而是可以在生产系统中作为角色持续存在。认知:AI 不只替代"做事",还可扮演"存在"。
3. AI 数据依赖边界 — 行业价值流转平台: 用 AI 构建一个描述行业价值流转关系(供应商→生产→渠道→客户)的可视化平台。收获:没有数据,代码只是空壳 — 数据才是灵魂。认知:领域数据资产 > 算法先进性。
4. AI 架构资产管理 — arch.intelab.cn:(见上) 把 AI 嵌入架构资产全生命周期管理。认知:治理治理本身。
核心方法论结论:这 4 个实验横切(coding / 部署 / 治理 / 数据本身)4 个 SDLC 维度,把"AI 能力边界"系统化。下一步目标是找一个真正理解 AI 能力边界的甲方平台,把广发银行成熟数据治理方法论 + AI 边界感组合起来,做企业级 AI 数据治理的下一阶段。
---
教育背景 (Education)
本科 | 华南师范大学 | 信息与计算科学(数学 + 计算机交叉)
---
技能与认证 (Skills & Certifications)
数据治理方法论
- DAMA-DMBOK2: 11 大数据管理职能 + 10 大环境要素(系统化方法论)
- DCMM: 5 大能力域(数据战略 / 治理 / 标准 / 质量 / 安全)+ 国家标准
- DSMM / ISO 8000 / DCAM: 国际数据治理框架(知识广度)
数据治理实战
- 数据血缘: 传统解析工具 + LLM 增强(80 万表级血缘,广发银行实战)
- 数据标准: 字段级标准体系 + 主数据模型(广发 16 万→9 万收敛)
- 数据质量: 完整性 / 准确性 / 一致性 / 及时性 / 唯一性 5 类规则 + 监控告警
- 数据架构: 企业级数据架构蓝图设计 + 嵌入研发流程事前管控
- 数据资源目录: AI 自动化评审 + 人工抽样检查(广发 200 目录 / 2000+ 实体)
AI / LLM 落地能力
- 生产模型选型: Qwen 3 (7B,广发银行 AI 数据血缘生产) / minimax m2.7(广发 AI 资源目录评审)
- 个人 AI 开发协作: Claude Code + MiniMax(日常 AI 辅助开发 + 架构探索)
- 角色定位: 模型需求方 + 业务需求定义 + 研发协作落地(不直接写 NLP 代码)
- LLM 数据血缘解析: 200+ 核心脚本解析(SQL / 存储过程 / 动态 SQL → 抽象语法树)
- AI 数据资源目录评审: minimax m2.7 + openclaw 框架,多维度打分 + 人工抽样
- Agentic AI 探索: 数据血缘从"静态追溯"升级为"动态决策依据"
编程与工具
- 后端: FastAPI / Python / Node.js
- 存储: PostgreSQL / MySQL / SQLite / 图数据库(血缘)
- AI: Claude(协作)/ Qwen 3(AI 血缘生产)/ minimax m2.7(AI 评审生产)
- 部署: Docker / GitHub Actions / nginx / certbot
- 数据: SQL / Spark SQL / Hive / Oracle
资质认证
- CDGP (数据治理专家级) — DAMA China · 高级
- CDGA (数据治理工程师级) — DAMA China · 中级
- DCMM 培训讲师 — 已培训 4 个企业数据治理团队
---
关键量化成果 (Proof Points)
| 维度 | 数字 | 上下文 |
|---|
| AI 数据血缘 | 80 万 表级血缘 | 广发银行 3 年累计,完成 100+ 应用模式切换 |
| 数据标准收敛 | 16 万 → 9 万 (-43%) | 字段级标准,推动 10 个重点应用贯标 |
| 培训覆盖 | 20 场 / 200 人次 | 贯标培训,覆盖技术骨干 |
| 监管报送治理 | 50% 空值率下降(50%→25%) | 银行核心日均 50 万笔交易 IP/MAC;应对"网上交易"监管定义模糊(国家金融监督管理总局 + 人民银行,行业普遍场景),通过渠道码值在报文头中传递 + 银行核心翻译轻量架构 + 分期交付(一期 5 实时+第三方支付 / 二期 3 批量)实现 |
| 数据资源目录 | 200 目录 / 2000+ 实体 / 60 人天 | AI 评审,释放架构师人力 |
| 数据架构评审 | 20 余项 / 千万元 | 年均重大数据类项目,影响研发预算 |
| DCMM 评估 | 20+ 家 | 主评估师 + 咨询顾问,覆盖制造/通信/消费 |
| 冷数据清理 | 500T | 直接节省行内存储成本 |
---
关于我 (About Me)
期望向数据部门总监或 CTO 层级汇报,2-3 年达部门负责人。底线 30K,期望 30-45K 区间(佛山 30-35K / 广州 35-40K / AI 40-45K)。DCMM 培训讲师。不接纯乙方实施 / 外包派遣(已校准)。