商品编号:YD-XKL-005
加工价格:1元/条
产品描述:音视频细颗粒标引加工
系统内实现自然语言处理(NLP)功能,能对全文内容进行智能分词、词性标注、实体识别、关系抽取、自动匹配、文本摘要、实体消歧等功能。
能针对不同类型数字资源,配置知识抽取模型,基于语料库准确抽取知识颗粒,基于开源词库抽取关键词或主题词以及知识颗粒。
具备自动查重功能,自动生成唯一标志符,确保对象数据及元数据的唯一性。
系统内实现对文本(文献)、图像、音视频等数字资源的标题、责任者、责任方式、文件名、摘要、目录、主题词、中图分类法、日期、地区、结构类型、来源、语种、格式、参数、版权信息、文件路径等元数据字段的自动获取与分类标引。
系统内集成OCR全文识别、版式还原及辅助校正功能。
系统内集成语音识别、场景识别功能。
1.基础资源著录:以“种”“部”为单元生成基础资源元数据。
2.细粒度著录:对基础资源析出的各个组成要素进行元数据著录,图书期刊等按封面、前言、目录、正文篇章等为著录单元;报纸按篇章、广告等为著录单元;古籍按书衣、封面、牌记、序、凡例、目录、插图、跋、签条、夹纸、校勘、附录、封底等为著录单元;音视频以每小节为著录单元;图像资源以单幅图像为著录单元。4.颗粒标记参考《指南》及推广工程元数据标准。