diff --git a/README_zh-CN.md b/README_zh-CN.md index 8732eb9..1a176c5 100644 --- a/README_zh-CN.md +++ b/README_zh-CN.md @@ -107,29 +107,41 @@ git submodule update --remote --merge ## 支持场景 -### 图片 +### 图像 -- 标签分类:标签分类可以帮助用户快速将图像中的物体进行分类,并且可以用于图像检索、目标检测等任务。 -- 文本描述:文本转写可以帮助用户快速提取图像中的文字信息,并且可以用于文本检索、机器翻译等任务。 -- 拉框:拉框可以帮助用户快速选择图像中的物体,并且可以用于图像识别、目标跟踪等任务。 -- 标点:点可以帮助用户准确地标注图像中的关键信息,并且可以用于物体识别、场景分析等任务。 -- 多边形:多边形可以帮助用户准确地标注不规则形状,并且可以用于物体识别、场景分析等任务。 -- 标线:线可以帮助用户准确地标注图像中的边缘和轮廓,并且可以用于物体识别、场景分析等任务。 -- 立体框:立体框可以帮助用户准确地标注图像中的物体大小、形状、位置等信息,并且可以用于物体识别、场景分析等任务。 +- **标签分类**:通过标签分类功能,用户可以快速对图像中的物体进行分类。这一功能不仅支持图像检索,还能用于目标检测等任务,使物体识别过程更加高效。 + +- **文本描述**:文本转写功能能够从图像中提取文字信息。这对于需要进行文本检索或机器翻译的任务来说非常实用,帮助用户快速获取图像中的关键信息。 + +- **拉框**:拉框工具让用户能够快速选择图像中的对象,适用于图像识别和目标跟踪等任务。这一功能简化了对象的标注过程,提高了工作效率。 + +- **标点**:标点工具帮助用户精确标注图像中的关键信息点,适用于对象识别和场景分析等任务。这种精确度对于复杂图像的分析尤为重要。 + +- **多边形**:多边形工具专为标注不规则形状的对象而设计,非常适用于物体识别和场景分析,确保用户能够准确标注各种复杂的形状。 + +- **标线**:标线工具用于精确标注图像中的边缘和轮廓,是对象识别和场景分析的重要辅助工具,帮助用户捕捉图像的细微特征。 + +- **立体框**:立体框工具能够帮助用户准确标注图像中的物体三维形状、位置等信息,适用于需要精确定位和形状分析的任务。 ### 视频 -- 标签分类:对视频进行分类和标签化,可运用于视频检索、推荐和分类等任务。 -- 文本描述:将视频中的语音内容转化为文字,可用于语音识别、语音转写和语音翻译等任务。 -- 片段分割:从视频中截取特定的片段或场景进行标注,对于视频目标检测、行为识别和视频摘要等任务非常有用。 -- 时间戳:指向或标记视频中的特定部分,用户可以点击时间戳即可直接跳转到视频的那个部分。 +- **标签分类**:对视频进行分类和标签化,可用于视频检索、推荐和分类任务,帮助用户有效管理和组织视频内容。 + +- **文本描述**:将视频中的语音内容转化为文字,支持语音识别、语音转写和语音翻译等任务,方便用户处理和理解视频中的音频信息。 + +- **片段分割**:从视频中截取特定的片段或场景进行标注,非常适合视频中的目标检测、行为识别和视频摘要等任务,提升视频分析的精度。 + +- **时间戳**:时间戳功能允许用户标记视频的特定部分,点击时间戳即可快速跳转到相应的片段,提高了视频内容浏览和处理的便捷性。 ### 音频 -- 标签分类:通过听取音频并选择合适的分类来进行标注,适用于音频检索、音频推荐和音频分类等任务。 -- 文本描述:将音频中的语音内容转化为文字,便于用户进行文本分析和处理。对于语音识别、语音转写等任务非常有用,可以帮助用户更好地理解和处理语音内容。 -- 片段分割:从音频中截取特定的片段进行标注,对于音频事件检测、语音识别和音频编辑等任务非常有用。 -- 时间戳:用于指向或标记音频中的特定部分,用户可以点击时间戳即可直接跳转到音频的那个部分。 +- **标签分类**:通过音频标签分类功能,用户可以听取音频并选择合适的分类,适用于音频检索、推荐和分类任务,帮助有效组织音频数据。 + +- **文本描述**:将音频中的语音内容转化为文字,便于进一步的文本分析和处理。此功能对语音识别和转写任务特别有用,帮助用户更好地理解和处理音频内容。 + +- **片段分割**:从音频中截取特定片段进行标注,对音频事件检测、语音识别和音频编辑等任务非常有用,增强了音频处理的灵活性。 + +- **时间戳**:时间戳功能用于标记音频中的特定部分,用户点击时间戳即可直接跳转到音频的那个部分,极大地提高了音频内容的导航和处理效率。 ## 快速上手