diff --git a/README_zh-CN.md b/README_zh-CN.md
index 8732eb9..1a176c5 100644
--- a/README_zh-CN.md
+++ b/README_zh-CN.md
@@ -107,29 +107,41 @@ git submodule update --remote --merge
 
 ## 支持场景
 
-### 图片
+### 图像
 
-- 标签分类：标签分类可以帮助用户快速将图像中的物体进行分类，并且可以用于图像检索、目标检测等任务。
-- 文本描述：文本转写可以帮助用户快速提取图像中的文字信息，并且可以用于文本检索、机器翻译等任务。
-- 拉框：拉框可以帮助用户快速选择图像中的物体，并且可以用于图像识别、目标跟踪等任务。
-- 标点：点可以帮助用户准确地标注图像中的关键信息，并且可以用于物体识别、场景分析等任务。
-- 多边形：多边形可以帮助用户准确地标注不规则形状，并且可以用于物体识别、场景分析等任务。
-- 标线：线可以帮助用户准确地标注图像中的边缘和轮廓，并且可以用于物体识别、场景分析等任务。
-- 立体框：立体框可以帮助用户准确地标注图像中的物体大小、形状、位置等信息，并且可以用于物体识别、场景分析等任务。
+- **标签分类**：通过标签分类功能，用户可以快速对图像中的物体进行分类。这一功能不仅支持图像检索，还能用于目标检测等任务，使物体识别过程更加高效。
+
+- **文本描述**：文本转写功能能够从图像中提取文字信息。这对于需要进行文本检索或机器翻译的任务来说非常实用，帮助用户快速获取图像中的关键信息。
+
+- **拉框**：拉框工具让用户能够快速选择图像中的对象，适用于图像识别和目标跟踪等任务。这一功能简化了对象的标注过程，提高了工作效率。
+
+- **标点**：标点工具帮助用户精确标注图像中的关键信息点，适用于对象识别和场景分析等任务。这种精确度对于复杂图像的分析尤为重要。
+
+- **多边形**：多边形工具专为标注不规则形状的对象而设计，非常适用于物体识别和场景分析，确保用户能够准确标注各种复杂的形状。
+
+- **标线**：标线工具用于精确标注图像中的边缘和轮廓，是对象识别和场景分析的重要辅助工具，帮助用户捕捉图像的细微特征。
+
+- **立体框**：立体框工具能够帮助用户准确标注图像中的物体三维形状、位置等信息，适用于需要精确定位和形状分析的任务。
 
 ### 视频
 
-- 标签分类：对视频进行分类和标签化，可运用于视频检索、推荐和分类等任务。
-- 文本描述：将视频中的语音内容转化为文字，可用于语音识别、语音转写和语音翻译等任务。
-- 片段分割：从视频中截取特定的片段或场景进行标注，对于视频目标检测、行为识别和视频摘要等任务非常有用。
-- 时间戳：指向或标记视频中的特定部分，用户可以点击时间戳即可直接跳转到视频的那个部分。
+- **标签分类**：对视频进行分类和标签化，可用于视频检索、推荐和分类任务，帮助用户有效管理和组织视频内容。
+
+- **文本描述**：将视频中的语音内容转化为文字，支持语音识别、语音转写和语音翻译等任务，方便用户处理和理解视频中的音频信息。
+
+- **片段分割**：从视频中截取特定的片段或场景进行标注，非常适合视频中的目标检测、行为识别和视频摘要等任务，提升视频分析的精度。
+
+- **时间戳**：时间戳功能允许用户标记视频的特定部分，点击时间戳即可快速跳转到相应的片段，提高了视频内容浏览和处理的便捷性。
 
 ### 音频
 
-- 标签分类：通过听取音频并选择合适的分类来进行标注，适用于音频检索、音频推荐和音频分类等任务。
-- 文本描述：将音频中的语音内容转化为文字，便于用户进行文本分析和处理。对于语音识别、语音转写等任务非常有用，可以帮助用户更好地理解和处理语音内容。
-- 片段分割：从音频中截取特定的片段进行标注，对于音频事件检测、语音识别和音频编辑等任务非常有用。
-- 时间戳：用于指向或标记音频中的特定部分，用户可以点击时间戳即可直接跳转到音频的那个部分。
+- **标签分类**：通过音频标签分类功能，用户可以听取音频并选择合适的分类，适用于音频检索、推荐和分类任务，帮助有效组织音频数据。
+
+- **文本描述**：将音频中的语音内容转化为文字，便于进一步的文本分析和处理。此功能对语音识别和转写任务特别有用，帮助用户更好地理解和处理音频内容。
+
+- **片段分割**：从音频中截取特定片段进行标注，对音频事件检测、语音识别和音频编辑等任务非常有用，增强了音频处理的灵活性。
+
+- **时间戳**：时间戳功能用于标记音频中的特定部分，用户点击时间戳即可直接跳转到音频的那个部分，极大地提高了音频内容的导航和处理效率。
 
 ## 快速上手