微调的各种问题 #40

python finetune.py data/AdvertiseGen/ /mnt/workspace/panyun/models/THUDM/glm-4-9b-chat configs/lora.yaml
Traceback (most recent call last):
File "/mnt/workspace/panyun/GLM-4/finetune_demo/finetune.py", line 15, in
from peft import PeftConfig, get_peft_config, get_peft_model
File "/opt/conda/lib/python3.10/site-packages/peft/init.py", line 22, in
from .auto import (
File "/opt/conda/lib/python3.10/site-packages/peft/auto.py", line 32, in
from .mapping import MODEL_TYPE_TO_PEFT_MODEL_MAPPING
File "/opt/conda/lib/python3.10/site-packages/peft/mapping.py", line 22, in
from .mixed_model import PeftMixedModel
File "/opt/conda/lib/python3.10/site-packages/peft/mixed_model.py", line 26, in
from peft.tuners.mixed import COMPATIBLE_TUNER_TYPES
File "/opt/conda/lib/python3.10/site-packages/peft/tuners/init.py", line 21, in
from .lora import LoraConfig, LoraModel, LoftQConfig
File "/opt/conda/lib/python3.10/site-packages/peft/tuners/lora/init.py", line 20, in
from .model import LoraModel
File "/opt/conda/lib/python3.10/site-packages/peft/tuners/lora/model.py", line 50, in
from .awq import dispatch_awq
File "/opt/conda/lib/python3.10/site-packages/peft/tuners/lora/awq.py", line 26, in
from awq.modules.linear import WQLinear_GEMM
File "/opt/conda/lib/python3.10/site-packages/awq/init.py", line 2, in
from awq.models.auto import AutoAWQForCausalLM
File "/opt/conda/lib/python3.10/site-packages/awq/models/init.py", line 1, in
from .mpt import MptAWQForCausalLM
File "/opt/conda/lib/python3.10/site-packages/awq/models/mpt.py", line 1, in
from .base import BaseAWQForCausalLM
File "/opt/conda/lib/python3.10/site-packages/awq/models/base.py", line 46, in
from awq.quantize.quantizer import AwqQuantizer
File "/opt/conda/lib/python3.10/site-packages/awq/quantize/quantizer.py", line 10, in
from awq.quantize.scale import apply_scale, apply_clip
File "/opt/conda/lib/python3.10/site-packages/awq/quantize/scale.py", line 8, in
from transformers.models.llama.modeling_llama import LlamaRMSNorm
File "/opt/conda/lib/python3.10/site-packages/transformers/models/llama/modeling_llama.py", line 55, in
from flash_attn import flash_attn_func, flash_attn_varlen_func
File "/opt/conda/lib/python3.10/site-packages/flash_attn/init.py", line 3, in
from flash_attn.flash_attn_interface import (
File "/opt/conda/lib/python3.10/site-packages/flash_attn/flash_attn_interface.py", line 10, in
import flash_attn_2_cuda as flash_attn_cuda
ImportError: /opt/conda/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64-linux-gnu.so: undefined symbol: _ZN2at4_ops5zeros4callEN3c108ArrayRefINS2_6SymIntEEENS2_8optionalINS2_10ScalarTypeEEENS6_INS2_6LayoutEEENS6_INS2_6DeviceEEENS6_IbEE

0 replies

pangaass · 2024-07-12T09:12:00Z

pangaass
Jul 12, 2024

8*80GA00,8k文本长度lora能调动吗？ds zero2或者zero3

0 replies

ChIIChI1230 · 2024-07-19T07:03:14Z

ChIIChI1230
Jul 19, 2024

微调后，评估时报错

2 replies

tzm529 Jul 19, 2024

哥们，我也遇到这个问题了，把transformers降到4.40.0，这个问题没有了，但是有了个新问题：

TypeError: Seq2SeqTrainingArguments.init() got an unexpected keyword argument 'eval_strategy'

zxy1119 Jul 31, 2024

我也遇到这个问题了，将 lora.yaml 里 eval_strategy 修改为 evaluation_strategy 就可以了

SongHY-13 · 2024-07-23T09:30:36Z

SongHY-13
Jul 23, 2024

想问一下GLM-4-9B模型是否支持在4张T4卡共64G显存配置的服务器上实现微调，感谢，因为包括我使用多模态模型还有微调时都会出现运行错误
RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:2 and cuda:3!