
医药招商企业排行
| 中医文史引文分析大模型系统 | |
| 项目所在采购意向: | 中国中医科学院中国医史文献研究所***年***至***月政府采购意向 |
| 采购单位: | 中国中医科学院中国医史文献研究所 |
| 采购项目名称: | 中医文史引文分析大模型系统 |
| 预算金额: | ***.***万元(人民币) |
| 采购品目: | C***行业应用软件开发服务 |
| 采购需求概况: | 中医文史引文分析大模型旨在顺应人工智能技术在古籍引文分析中的应用趋势,通过自然语言处理、数据挖掘等技术,高效地提取、整理和分析古籍中的引文信息,进而揭示典籍间的关联及学术影响力。建设目标:研发一个集古籍文本管理、智能语义检索、引文分析于一体的中医文史大模型系统。该系统应具备高效的古籍数据处理能力和精准的语义理解与检索能力,通过集成先进的大语言模型技术,为中医文史研究提供智能化的辅助工具,实现与平台主系统的无缝集成。功能需求:批量、快速和准确地识别出古籍的引文内容,引文的出处信息(书名、篇卷、作者、成书年代);研发文本相似性技术,输出对文本相似性的评估,用百分比描述两个文本的相似程度,***%代表完全相似。可实现按句、按段进行比较。。1、数据库建设:设计建成可存储约 *** 种古籍文本内容且支持复杂结构的数据库,实现关键元数据高效关联;构建存储训练数据集、模型参数等的数据库体系,保障数据一致性、完整性与可追溯性。2、大模型构建训练:构建统一模型仓库,集成管理多种开源及闭源大语言模型,实现版本控制与资源监控;建立训练框架对选定模型领域微调,提升古汉语理解与引文分析性能;研究实施 RLHF 技术,利用专家反馈优化模型。3、语义检索系统开发:训练或微调古汉语专用词向量模型提升语义表征;构建 RAG 架构并设计古籍文本智能分块策略优化检索粒度;实现融合向量与全文检索的混合系统,支持按句、段、篇等多粒度检索。技术研发需求:引文溯源技术开发:开发面向中医古籍段落语义溯源分析技术,支持对指定古籍段落的发展脉络进行分析与溯源图谱生成。附应用场景说明:不明确引文出处处理:用户向系统中输入一句话或一段话后,系统会在所有文本(一本书为一个文本)里搜寻与之相似的内容,并输出该段文字的引用情况,包括出处信息(书名、篇卷、作者、成书年代)、引用相似的文本(原文与引文相似处突出显示)以及相似度量化值。明确引文出处处理:用户上传包含大量引用内容(如《外台秘要》,引用内容采用明引)的书后,系统会按引用内容的来源拆解该书(拆解出引用文献的书名和引用内容),用户选取“文献的书名”,系统将拆解内容逐条与原始出处内容比对,输出卷篇、内容、来源信息、来源内容以及相似度量化值(可能存在找不到引文原始出处的情况,原因包括标记出处错误、系统资料无此书、亡佚或版本差异等)。 |
| 预计采购时间: | *** |
| 备注: | 要求注册资金超过***万元;获得大模型、智能体等相关技术软著/专利;主要负责人具备副高及其以上职称;具备自有AI算力及相关设施优先;近3年承担过大模型、智能体相关研发项目优先;具备满足上述需求的初步演示系统者优先。 |
本次公开的采购意向是本单位政府采购工作的初步安排,具体采购项目情况以相关采购公告和采购文件为准。