From 2042df8adb5d352d8a3ba6c1b93e08519979e5a0 Mon Sep 17 00:00:00 2001 From: LovelyGuYiMeng <76251800+LovelyGuYiMeng@users.noreply.github.com> Date: Mon, 21 Oct 2024 00:03:21 +0800 Subject: [PATCH] =?UTF-8?q?=F0=9F=92=84=20style:=20add=20Ministral=20model?= =?UTF-8?q?=20(#4427)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit * Update zhipu.ts * Update hunyuan.ts * Update mistral.ts * Update mistral.ts * Update mistral.ts --- src/config/modelProviders/hunyuan.ts | 23 +++++------ src/config/modelProviders/mistral.ts | 60 +++++++++++++++++++++++++++- src/config/modelProviders/zhipu.ts | 28 ++++++------- 3 files changed, 83 insertions(+), 28 deletions(-) diff --git a/src/config/modelProviders/hunyuan.ts b/src/config/modelProviders/hunyuan.ts index 5499da109cc8..cde75f702d21 100644 --- a/src/config/modelProviders/hunyuan.ts +++ b/src/config/modelProviders/hunyuan.ts @@ -71,31 +71,30 @@ const Hunyuan: ModelProviderCard = { tokens: 32_000, }, { - description: '混元最新代码生成模型,经过 200B 高质量代码数据增训基座模型,迭代半年高质量 SFT 数据训练,上下文长窗口长度增大到 8K,五大语言代码生成自动评测指标上位居前列;五大语言10项考量各方面综合代码任务人工高质量评测上,性能处于第一梯队', - displayName: 'Hunyuan Code', + description: '混元最新多模态模型,支持图片+文本输入生成文本内容。', + displayName: 'Hunyuan Vision', enabled: true, - id: 'hunyuan-code', + id: 'hunyuan-vision', maxOutput: 4000, pricing: { currency: 'CNY', - input: 4, - output: 8, + input: 18, + output: 18, }, tokens: 8000, + vision: true, }, { - description: '混元最新多模态模型,支持图片+文本输入生成文本内容。', - displayName: 'Hunyuan Vision', - enabled: true, - id: 'hunyuan-vision', + description: '混元最新代码生成模型,经过 200B 高质量代码数据增训基座模型,迭代半年高质量 SFT 数据训练,上下文长窗口长度增大到 8K,五大语言代码生成自动评测指标上位居前列;五大语言10项考量各方面综合代码任务人工高质量评测上,性能处于第一梯队', + displayName: 'Hunyuan Code', + id: 'hunyuan-code', maxOutput: 4000, pricing: { currency: 'CNY', - input: 18, - output: 18, + input: 4, + output: 8, }, tokens: 8000, - vision: true, }, { description: '混元最新 MOE 架构 FunctionCall 模型,经过高质量的 FunctionCall 数据训练,上下文窗口达 32K,在多个维度的评测指标上处于领先。', diff --git a/src/config/modelProviders/mistral.ts b/src/config/modelProviders/mistral.ts index 06f24268b045..87b7bc3185ad 100644 --- a/src/config/modelProviders/mistral.ts +++ b/src/config/modelProviders/mistral.ts @@ -11,6 +11,10 @@ const Mistral: ModelProviderCard = { enabled: true, functionCall: true, id: 'open-mistral-nemo', + pricing: { + input: 0.15, + output: 0.15, + }, tokens: 128_000, }, { @@ -20,6 +24,10 @@ const Mistral: ModelProviderCard = { enabled: true, functionCall: true, id: 'mistral-small-latest', + pricing: { + input: 0.2, + output: 0.6, + }, tokens: 128_000, }, { @@ -29,6 +37,10 @@ const Mistral: ModelProviderCard = { enabled: true, functionCall: true, id: 'mistral-large-latest', + pricing: { + input: 2, + output: 6, + }, tokens: 128_000, }, { @@ -36,6 +48,10 @@ const Mistral: ModelProviderCard = { displayName: 'Codestral', enabled: true, id: 'codestral-latest', + pricing: { + input: 0.2, + output: 0.6, + }, tokens: 32_768, }, { @@ -44,14 +60,44 @@ const Mistral: ModelProviderCard = { displayName: 'Pixtral 12B', enabled: true, id: 'pixtral-12b-2409', + pricing: { + input: 0.15, + output: 0.15, + }, tokens: 128_000, vision: true, }, + { + description: + 'Ministral 3B 是Mistral的世界顶级边缘模型。', + displayName: 'Ministral 3B', + id: 'ministral-3b-latest', + pricing: { + input: 0.04, + output: 0.04, + }, + tokens: 128_000, + }, + { + description: + 'Ministral 8B 是Mistral的性价比极高的边缘模型。', + displayName: 'Ministral 8B', + id: 'ministral-8b-latest', + pricing: { + input: 0.1, + output: 0.1, + }, + tokens: 128_000, + }, { description: 'Mistral 7B是一款紧凑但高性能的模型,擅长批量处理和简单任务,如分类和文本生成,具有良好的推理能力。', displayName: 'Mistral 7B', id: 'open-mistral-7b', + pricing: { + input: 0.25, + output: 0.25, + }, tokens: 32_768, }, { @@ -59,6 +105,10 @@ const Mistral: ModelProviderCard = { 'Mixtral 8x7B是一个稀疏专家模型,利用多个参数提高推理速度,适合处理多语言和代码生成任务。', displayName: 'Mixtral 8x7B', id: 'open-mixtral-8x7b', + pricing: { + input: 0.7, + output: 0.7, + }, tokens: 32_768, }, { @@ -67,6 +117,10 @@ const Mistral: ModelProviderCard = { displayName: 'Mixtral 8x22B', functionCall: true, id: 'open-mixtral-8x22b', + pricing: { + input: 2, + output: 6, + }, tokens: 65_536, }, { @@ -74,10 +128,14 @@ const Mistral: ModelProviderCard = { 'Codestral Mamba是专注于代码生成的Mamba 2语言模型,为先进的代码和推理任务提供强力支持。', displayName: 'Codestral Mamba', id: 'open-codestral-mamba', + pricing: { + input: 0.15, + output: 0.15, + }, tokens: 256_000, }, ], - checkModel: 'open-mistral-7b', + checkModel: 'ministral-3b-latest', description: 'Mistral 提供先进的通用、专业和研究型模型,广泛应用于复杂推理、多语言任务、代码生成等领域,通过功能调用接口,用户可以集成自定义功能,实现特定应用。', id: 'mistral', diff --git a/src/config/modelProviders/zhipu.ts b/src/config/modelProviders/zhipu.ts index d74145d6cd7e..82872a147ad8 100644 --- a/src/config/modelProviders/zhipu.ts +++ b/src/config/modelProviders/zhipu.ts @@ -69,6 +69,19 @@ const ZhiPu: ModelProviderCard = { }, tokens: 8192, }, + { + description: + 'GLM-4-AllTools 是一个多功能智能体模型,优化以支持复杂指令规划与工具调用,如网络浏览、代码解释和文本生成,适用于多任务执行。', + displayName: 'GLM-4-AllTools', + functionCall: true, + id: 'glm-4-alltools', + pricing: { + currency: 'CNY', + input: 100, + output: 100, + }, + tokens: 128_000, + }, { description: 'GLM-4-Plus 作为高智能旗舰,具备强大的处理长文本和复杂任务的能力,性能全面提升。', @@ -132,21 +145,6 @@ const ZhiPu: ModelProviderCard = { tokens: 2048, vision: true, }, - { - description: - 'GLM-4-AllTools 是一个多功能智能体模型,优化以支持复杂指令规划与工具调用,如网络浏览、代码解释和文本生成,适用于多任务执行。', - displayName: 'GLM-4-AllTools', - enabled: true, - functionCall: true, - id: 'glm-4-alltools', - pricing: { - currency: 'CNY', - input: 100, - output: 100, - }, - tokens: 128_000, - vision: true, - }, { description: 'CodeGeeX-4 是强大的AI编程助手,支持多种编程语言的智能问答与代码补全,提升开发效率。',