中文古籍 OCR 学术版源自北京市海淀区龙泉寺藏经办公室与华南理工大学深度学习与视觉计算实验室的学术性合作。工作起步于 2017 年,初始训练数据为前者提供的汉文大藏经的高清图片,双方共同完成数据标注,后者负责模型的设计与训练。 历经若干次数据扩充和模型升级,这里发布的版本完成于 2020 年,包含三项基础功能:单字识别,单列识别,检测。
中央研究院历史语言研究所与韩国国史编纂委员会合作建设,包含:明实录、朝鲜王朝实录、清实录。
中國歷代人物傳記資料庫由中研院史語所、哈佛大學、北京大學中古史中心共建,本站已收錄哈佛大學 CBDB、台灣人名權 […]
中研院文字辨識與校對平台提供使用者上傳文本的數位圖像檔案,平台會自動將圖像中的文字內容辨識為文字格式,同時也提 […]
支持自動標記句讀標點、書名、專名等。即使處理大規模文本,仍能立等可取。基於先進的深度學習 (DeepLearn[…]
中国诗典
這是一個歷史語言學材料和工具的共享站,主要用於探索漢語的早期歷史。鏡子原是便攜照容工具,這裡指電子查詢,取其方 […]
要发表评论,您必须先登录。
中央研究院历史语言研究所与韩国国史编纂委员会合作建设,包含:明实录、朝鲜王朝实录、清实录。