结构化数据层:六大库互联的知识图谱
中间层的数据不是散装黄页。材料 / 配方 / 标准 / 论文 / 专利 / 供应商 六张表通过外键和语义相似度互相链接,形成工程师走进来后永远有下一步的知识图谱。
四条数据原则
材料页挂相关配方 / 推荐供应商 / 下载资源;配方页链接材料明细;论文页显示相关论文;专利页显示同类专利。任何一页都是进入其他五库的入口。
每条材料参数未来会标注来源类型(厂家 TDS / 第三方测试 / AI 推断)。每篇论文带 DOI 外链,每件专利带 Google Patents 外链。
cron 每天 2am UTC 自动拉 CrossRef + OpenAlex + Google Patents + RSS 新内容,入库 + 翻译 + 生成中文解读 + sitemap 更新 + 搜索引擎推送。
除了代码自动拉取,企业可主动认领自家 supplier listing 补全资料,工程师可提交纠错反馈。
当前库容与结构
覆盖树脂 / 玻璃纤维(纱 / 毡 / 布)/ 碳纤维 / 玄武岩 / 芳纶 / 生物基 / 芯材 / 胶衣 / 辅材 / 复合制品。每条含力学、热学、物理性能结构化参数。
按 7 大工艺(手糊 / 缠绕 / 拉挤 / 模压 / RTM / 真空导入 / 3D 打印)分组。每条含树脂体系、增强材料、辅材、工艺参数、预期性能、实操要点、安全须知。
中国 GB / HG / JC,国际 ISO,美国 ASTM,欧洲 EN,德国 DIN。按工艺和产品分类,每标准带 AI 章节解读(路线图中)。
CrossRef + OpenAlex 聚合。覆盖力学失效、工艺制造、纤维增强、树脂基体、耐久性、回收等方向。每篇带 AI 中文解读。
Google Patents 聚合中美欧日韩专利。覆盖拉挤 / RTM / HP-RTM / 热塑拉挤 / 门窗 / 汽车 / 风电等方向。中文解读正在回填。
真实复材行业企业,已认领的带联系邮箱可直接接 RFQ。目前包含中国复材头部企业(巨石、中复神鹰、泰和、华昌等)。
技术栈
ap-southeast-1 区域,按用量计费。Schema 14 张表 + 5 枚举。Drizzle ORM 提供类型安全查询。
每条内容过 OpenAI text-embedding-3-small 生成 1536 维向量,存入 knowledge_chunks 表,通过 HNSW 索引支持毫秒级语义搜索。
sources.ts 提供 CrossRef / OpenAlex / Google Patents / RSS 统一接口;每日 cron 按 query-pool 轮转主题采集;自动去重(DOI / 公开号)。
Gemini 2.5 Flash 做 translate 和 commentary;高失败率时切 Claude Haiku via OpenRouter。整个 pipeline 幂等、可回填。
入口
每个库都有独立列表页,支持多维筛选(分类 / 品牌 / 国家 / 年份 / 语言 / 工艺)、搜索、对比。
点开详情页:材料页显示参数表 + 推荐供应商 + 相关配方 + 下载资源;论文 / 专利页显示中文解读 + 相关条目 + 外链原文。
AI 对话里的 [#N] 直通数据层任一条目。数据不是孤立的,是 AI 答案的证据。
下一年扩容方向
数据本身扩展到德 / 日 / 俄 / 西 / 葡 5 种语言,海外获客翻倍。
2027 H1
每条材料参数带 source_type(TDS / 第三方 / AI 推断)+ confidence(0-1)。UI 显示 Verified / Claimed / Estimated 徽章。
Q4 2026
关键参数(tensile / modulus / Tg / 吸水)从单值升级为温度×参数时间序列。S-N 疲劳、蠕变、吸水曲线入库。
2027 H1
REST API 开放给 ERP / PLM / CAE 厂商。按调用量计费,成为行业数据底座。
Q1 2027
材料从 4,341 扩到 100,000 级别,对标 MatWeb。增加更多级别、更多批次、更多温度下性能数据。
2027 全年
持续迭代,欢迎建议。