彝族文化博大精深,源远流长,光辉灿烂,是中华民族优秀传统文化的重要组成部分。彝族文化自发端至今,已历经8000年文明的涤荡,在这漫长的8000年历史演进中,无论是在天文、历法、文字、还是哲学、艺术、生活技艺等诸多方面,彝族都有非常独特的创造。其中,古彝文更是传承数千年,是世界上最古老的文字之一。
2022年12月21日,合合信息与上海大学社会学院正式签署校企合作协议,双方将合力完成以国家珍贵古籍《西南彝志》为中心的贵州古彝文图像识别及数字化校对项目(简称“古彝文数字化项目”)。
据了解,此次上海大学携手合合信息推进的古彝文数字化项目更侧重于对原生态彝文识别的攻坚克难,项目将根据上海大学古彝文研究员设计的四字节编码系统,引入合合信息智能文字识别技术,对异体字、变体字、误用字和混用字等进行标注、识别、比对,并由此建立起精确的彝文古籍电子数据库,在古彝文研究领域属于首创。
根据《滇川黔桂彝文字集》,目前记录在册的古彝文多达87046个,翻译难度可见一斑。与此同时,合合信息智能技术平台事业部副总经理郭丰俊表示,彝文古籍时常出现加字、替字、整句倒置、文字方向不统一等现象,更是给文字定位造成挑战,再加上古彝文从未经过统一,异体字、变体字众多,因此合合信息将基于“AI+OCR”融合下的智能文字识别技术,解决古彝文识别的版式检测、图像处理和文字识别等难题。
此前,合合信息用AI技术对甲骨文、西周钟鼎文进行精准识别,受到了包括央视、人民日报、新华社在内的上百家主流媒体的关注。对于都属于以刻画符号表意的文字,甲骨文和古彝文这两种文字的识别方式有相通之处。此次古彝文数字化项目的开启,必将成为合合信息智能文字识别技术赋能文字保护及文化传承的重要里程碑,也将是古彝文“传统的新生命周期”的开始。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com