通用古文字检测定位系统发布(河南大学 张重生)
通用古文字检测定位系统正式发布
张重生 河南大学
2026年6月18日,国家社科基金重大项目“人机协同的甲骨分类缀合研究”(23&ZD309)的阶段性成果——“通用古文字检测系统”在国际大模型托管平台HuggingFace上正式发布,并在先秦网等出土文献和古文字研究专业网站上发布了相关资讯。系统由该国家社科基金重大项目的子课题负责人、河南大学张重生教授研制。

图1 通用古文字检测系统,支持甲骨文检测、简牍文字检测,准确率分别约为90%和94%
甲骨文检测、简牍文字检测,是指将甲骨文拓本和简牍材料中的文字自动定位,并支持后续的自动剪切,在古文字材料基础整理中具有重要实用价值。事实上,早在2018-2019年,张重生、门艺课题组已经研制出了甲骨文检测和识别的软件,相关成果发表在计算机顶会IJCAI 2020上(https://www.ijcai.org/proceedings/2020/779)。 但当时的模型主要在本地、供课题组内部使用,其他单位和人员使用时则需要自行在个人电脑上安装,不能方便使用,而且还不支持简牍文字检测。
本次发布的通用古文字检测系统,既支持甲骨文检测,又支持简牍上的文字检测,具有通用性。而且,该系统在国际通用的大模型托管平台HuggingFace上发布,方便全世界尤其是我国的学者使用,学者只需要打开浏览器便可使用该系统,并支持批处理和结果下载。
甲骨文检测、简牍文字检测和定位的工作,学界已经有了一些,但读者(尤其是古文字和出土文献领域的研究人员)往往是只闻其声、不见其“形”,无法直接使用和体验相关模型和产品。真正能让学界和领域专家直接、方便使用的相关产品很少见,同时支持甲骨文检测和简牍文字检测的在线系统则几乎没有。张重生表示:“做产品是最难的,比学术研究难多了。因为,很多论文发表之后,往往就沉寂了;而产品发布后,会被很多人使用,同时,别人会在使用的过程中会对我们提出更高的要求和期望。古文字智能研究方面,我们不只做抽象的研究,更注重实际产品的研发和落地,并分享出去、造福学界,尤其是甲骨学界和简牍学界。本次发布的通用古文字检测系统,同时支持甲骨文检测、简牍文字检测,准确率分别为90%和94%左右,对古文字的检测定位极其精准,是产品级的技术”。
“通用古文字检测定位系统”的网址(注:有时需要在能上谷歌的情况下使用):
https://huggingface.co/spaces/cszhangai/ancient-chinese-character-detection
先秦网上通用古文字检测定位系统的相关资讯:
https://www.xianqin.org/blog/archives/24762.html
经费支持:
①2023年度国家社科基金重大项目“人机协同的甲骨分类缀合研究”(23&ZD309),项目负责人(复旦大学蒋玉斌教授),张重生为该项目的(子)课题负责人;
②2023年度教育部人文社会科学研究一般项目“人工智能在西北汉简缀合中的应用研究”(23YJAZH210),项目负责人:张重生;
③“新一代人工智能与黄河文化遗产保护利用”河南省杰出外籍科学家工作室(GZS2020043),项目负责人:张重生。
平台支持:
河南大学历史文化学院(科技考古实验室);
河南省文字文化研究院;
河南大学黄河文化遗产实验室(河南省首批哲学社会科学实验室);
教育部人文社科重点研究基地——河南大学黄河文明与可持续发展研究中心;
河南大学计算机与信息工程学院;
河南省大数据分析与处理重点实验室。
联系方式:
张重生,cszhang@henu.edu.cn
https://cszhanglmu.github.io/
本文章的固定链接:https://www.xianqin.org/blog/archives/24767.html
相关资讯:
