您的位置:首 页 > 产品介绍 > 细颗粒标引 > 音视频细颗粒标引加工

细颗粒标引

  • 音视频细颗粒标引加工
音视频细颗粒标引加工

音视频细颗粒标引加工

    商品编号:YD-XKL-005

    加工价格:1元/条

    产品描述:音视频细颗粒标引加工

  • 在线订购

系统内实现自然语言处理(NLP)功能,能对全文内容进行智能分词、词性标注、实体识别、关系抽取、自动匹配、文本摘要、实体消歧等功能。
能针对不同类型数字资源,配置知识抽取模型,基于语料库准确抽取知识颗粒,基于开源词库抽取关键词或主题词以及知识颗粒。
具备自动查重功能,自动生成唯一标志符,确保对象数据及元数据的唯一性。
系统内实现对文本(文献)、图像、音视频等数字资源的标题、责任者、责任方式、文件名、摘要、目录、主题词、中图分类法、日期、地区、结构类型、来源、语种、格式、参数、版权信息、文件路径等元数据字段的自动获取与分类标引。
系统内集成OCR全文识别、版式还原及辅助校正功能。
系统内集成语音识别、场景识别功能。


1.基础资源著录:以“种”“部”为单元生成基础资源元数据。

2.细粒度著录:对基础资源析出的各个组成要素进行元数据著录,图书期刊等按封面、前言、目录、正文篇章等为著录单元;报纸按篇章、广告等为著录单元;古籍按书衣、封面、牌记、序、凡例、目录、插图、跋、签条、夹纸、校勘、附录、封底等为著录单元;音视频以每小节为著录单元;图像资源以单幅图像为著录单元。
3.每个著录单元的著录信息生成一条析出元数据,整个资源对象生成一条基础资源元数据。
4.文献所包含的插图和表格应作为图表进行著录。
5.每个著录单元的对象数据应该是一个主题一致、内容连贯的整体。
6.著录标准参考《指南》及数字推广工程元数据标准。
1.充分抽取对象资源中的具有标目意义的核心人物、机构、事件、实物、地理名称、项目、主题词、专题、片段、场景等颗粒。
2.同一对象资源中不同位置的相同颗粒应合并为一条数据,并标记其在资源中的位置信息。
3.抽取的颗粒应以湖南及湖南有关的内容为主。

4.颗粒标记参考《指南》及推广工程元数据标准。


上一个:没有了 下一个:古籍细颗粒标引加工
用手机扫描二维码关闭
二维码