中文古籍OCR学术版源自北京市海淀区龙泉寺藏经办公室与华南理工大学深度学习与视觉计算实验室的学术性合作。工作起步于2017年,初始训练数据为前者提供的汉文大藏经的高清图片,双方共同完成数据标注,后者负责模型的设计与训练。 历经若干次数据扩充和模型升级,这里发布的版本完成于2020年,包含三项基础功能:单字识别,单列识别,检测。
萌典共收錄十六萬筆國語、兩萬筆臺語、一萬四千筆客語條目,並支援「自動完成」功能及「%_*?^.$」等萬用字[…]
用技术展现传统文化,发掘艺术瑰宝的价值,探索古籍世界的无限智慧。使用先进古籍识别OCR算法对古籍内容进行识别展[…]
词汇分析:支持对大量词汇进行统计分析、共现分析;句子分析:支持检索任一书籍中的句子,并对句子进行重文分析;书籍[…]
"古籍智能"网站的目标是:在古籍整理与研究领域和信息技术领域二者之间,搭建起沟通和协作的桥梁,报道业界和学术界[…]
中研院文字辨識與校對平台提供使用者上傳文本的數位圖像檔案,平台會自動將圖像中的文字內容辨識為文字格式,同時也提[…]
當代的西曆稱為格理哥里(Gregorian)曆,由教皇格理哥里十三世頒行,於1582年10月15日啟用。在此之[…]
要发表评论,您必须先登录。
萌典共收錄十六萬筆國語、兩萬筆臺語、一萬四千筆客語條目,並支援「自動完成」功能及「%_*?^.$」等萬用字[…]