Optimize the model loading logic of Qwen3.

戒酒的李白
Commit ad27791e1c98d528d5e4623245b32c124959130f ad27791e 1 parent c4af1eff
Showing 3 changed files with 103 additions and 71 deletions
WeiboSentiment_SmallQwen/predict_universal.py
WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
WeiboSentiment_SmallQwen/qwen3_lora_universal.py
--- a/WeiboSentiment_SmallQwen/predict_universal.py
View file @ad27791
+++ b/WeiboSentiment_SmallQwen/predict_universal.py
View file @ad27791
@@ -37,11 +37,14 @@ class Qwen3UniversalPredictor:
             raise ValueError(f"不支持的模型大小: {model_size}")
             
         model_path = MODEL_PATHS[model_type][model_size]
+         model_key = self._get_model_key(model_type, model_size)
+         
+         # 检查训练好的模型文件是否存在
         if not os.path.exists(model_path):
-             print(f"模型文件不存在: {model_path}")
+             print(f"训练好的模型文件不存在: {model_path}")
+             print(f"请先训练 {model_type.upper()}-{model_size} 模型，或检查模型路径配置")
             return
         
-         model_key = self._get_model_key(model_type, model_size)
         print(f"加载 {model_type.upper()}-{model_size} 模型...")
         
         try:
@@ -60,6 +63,7 @@ class Qwen3UniversalPredictor:
             
         except Exception as e:
             print(f"加载 {model_type.upper()}-{model_size} 模型失败: {e}")
+             print(f"这可能是因为基础模型下载失败或训练好的模型文件损坏")
     
     def load_all_models(self, model_dir: str = './models') -> None:
         """加载所有可用的模型"""
--- a/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
View file @ad27791
+++ b/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
View file @ad27791
@@ -103,46 +103,61 @@ class Qwen3EmbeddingUniversal(BaseQwenModel):
         """加载Qwen3 Embedding模型"""
         print(f"加载{self.model_size}模型: {self.model_name_hf}")
         
+         # 第一步：检查当前文件夹的models目录
+         local_model_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
+         if os.path.exists(local_model_dir) and os.path.exists(os.path.join(local_model_dir, "config.json")):
+             try:
+                 print(f"发现本地模型，从本地加载: {local_model_dir}")
+                 self.tokenizer = AutoTokenizer.from_pretrained(local_model_dir)
+                 self.embedding_model = AutoModel.from_pretrained(local_model_dir).to(self.device)
+                 print(f"从本地模型加载{self.model_size}模型成功")
+                 return
+                 
+             except Exception as e:
+                 print(f"本地模型加载失败: {e}")
+         
+         # 第二步：检查HuggingFace缓存
         try:
+             from transformers.utils import default_cache_path
+             cache_path = default_cache_path
+             print(f"检查HuggingFace缓存: {cache_path}")
+             
             self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
             self.embedding_model = AutoModel.from_pretrained(self.model_name_hf).to(self.device)
-             print(f"{self.model_size}模型加载完成")
+             print(f"从HuggingFace缓存加载{self.model_size}模型成功")
             
-             # 立即保存到本地缓存
-             cache_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
-             if not os.path.exists(cache_dir):
-                 print(f"保存模型到本地: {cache_dir}")
-                 os.makedirs(cache_dir, exist_ok=True)
-                 self.tokenizer.save_pretrained(cache_dir)
-                 self.embedding_model.save_pretrained(cache_dir)
-                 print(f"模型已保存到: {cache_dir}")
+             # 保存到本地models目录
+             print(f"保存模型到本地: {local_model_dir}")
+             os.makedirs(local_model_dir, exist_ok=True)
+             self.tokenizer.save_pretrained(local_model_dir)
+             self.embedding_model.save_pretrained(local_model_dir)
+             print(f"模型已保存到: {local_model_dir}")
             
         except Exception as e:
-             print(f"从Hugging Face加载失败: {e}")
+             print(f"从HuggingFace缓存加载失败: {e}")
             
-             # 尝试从本地缓存加载
-             cache_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
+             # 第三步：从HuggingFace下载
             try:
-                 if os.path.exists(cache_dir):
-                     self.tokenizer = AutoTokenizer.from_pretrained(cache_dir)
-                     self.embedding_model = AutoModel.from_pretrained(cache_dir).to(self.device)
-                     print(f"从本地缓存加载{self.model_size}模型成功")
-                 else:
-                     raise FileNotFoundError("本地缓存也不存在")
-                     
-             except Exception as e2:
-                 print(f"本地加载也失败: {e2}")
-                 print(f"正在下载{self.model_size}模型...")
+                 print(f"正在从HuggingFace下载{self.model_size}模型...")
+                 
+                 self.tokenizer = AutoTokenizer.from_pretrained(
+                     self.model_name_hf,
+                     force_download=True
+                 )
+                 self.embedding_model = AutoModel.from_pretrained(
+                     self.model_name_hf,
+                     force_download=True
+                 ).to(self.device)
                 
-                 # 创建缓存目录并下载
-                 os.makedirs(cache_dir, exist_ok=True)
-                 self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf, cache_dir=cache_dir)
-                 self.embedding_model = AutoModel.from_pretrained(self.model_name_hf, cache_dir=cache_dir).to(self.device)
+                 # 保存到本地models目录
+                 os.makedirs(local_model_dir, exist_ok=True)
+                 self.tokenizer.save_pretrained(local_model_dir)
+                 self.embedding_model.save_pretrained(local_model_dir)
+                 print(f"{self.model_size}模型下载并保存到: {local_model_dir}")
                 
-                 # 保存到本地
-                 self.tokenizer.save_pretrained(cache_dir)
-                 self.embedding_model.save_pretrained(cache_dir)
-                 print(f"{self.model_size}模型下载并保存到: {cache_dir}")
+             except Exception as e2:
+                 print(f"从HuggingFace下载也失败: {e2}")
+                 raise RuntimeError(f"无法加载{self.model_size}模型，所有方法都失败了")
     
     def train(self, train_data: List[Tuple[str, int]], **kwargs) -> None:
         """训练模型"""
--- a/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
View file @ad27791
+++ b/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
View file @ad27791
@@ -46,7 +46,35 @@ class Qwen3LoRAUniversal(BaseQwenModel):
         """加载Qwen3基础模型"""
         print(f"加载{self.model_size}基础模型: {self.model_name_hf}")
         
+         # 第一步：检查当前文件夹的models目录
+         local_model_dir = f"./models/qwen3-{self.model_size.lower()}"
+         if os.path.exists(local_model_dir) and os.path.exists(os.path.join(local_model_dir, "config.json")):
+             try:
+                 print(f"发现本地模型，从本地加载: {local_model_dir}")
+                 self.tokenizer = AutoTokenizer.from_pretrained(local_model_dir)
+                 self.base_model = AutoModelForCausalLM.from_pretrained(
+                     local_model_dir,
+                     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
+                     device_map="auto" if torch.cuda.is_available() else None
+                 )
+                 
+                 # 设置pad_token
+                 if self.tokenizer.pad_token is None:
+                     self.tokenizer.pad_token = self.tokenizer.eos_token
+                     self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
+                 
+                 print(f"从本地模型加载{self.model_size}基础模型成功")
+                 return
+                 
+             except Exception as e:
+                 print(f"本地模型加载失败: {e}")
+         
+         # 第二步：检查HuggingFace缓存
         try:
+             from transformers.utils import default_cache_path
+             cache_path = default_cache_path
+             print(f"检查HuggingFace缓存: {cache_path}")
+             
             self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
             self.base_model = AutoModelForCausalLM.from_pretrained(
                 self.model_name_hf,
@@ -59,49 +87,29 @@ class Qwen3LoRAUniversal(BaseQwenModel):
                 self.tokenizer.pad_token = self.tokenizer.eos_token
                 self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
             
-             print(f"{self.model_size}基础模型加载完成")
+             print(f"从HuggingFace缓存加载{self.model_size}基础模型成功")
             
-             # 立即保存到本地缓存
-             cache_dir = f"./models/qwen3-{self.model_size.lower()}"
-             if not os.path.exists(cache_dir):
-                 print(f"保存模型到本地: {cache_dir}")
-                 os.makedirs(cache_dir, exist_ok=True)
-                 self.tokenizer.save_pretrained(cache_dir)
-                 self.base_model.save_pretrained(cache_dir)
-                 print(f"模型已保存到: {cache_dir}")
+             # 保存到本地models目录
+             print(f"保存模型到本地: {local_model_dir}")
+             os.makedirs(local_model_dir, exist_ok=True)
+             self.tokenizer.save_pretrained(local_model_dir)
+             self.base_model.save_pretrained(local_model_dir)
+             print(f"模型已保存到: {local_model_dir}")
             
         except Exception as e:
-             print(f"从Hugging Face加载失败: {e}")
+             print(f"从HuggingFace缓存加载失败: {e}")
             
-             # 尝试从本地缓存加载
-             cache_dir = f"./models/qwen3-{self.model_size.lower()}"
+             # 第三步：从HuggingFace下载
             try:
-                 if os.path.exists(cache_dir):
-                     self.tokenizer = AutoTokenizer.from_pretrained(cache_dir)
-                     self.base_model = AutoModelForCausalLM.from_pretrained(
-                         cache_dir,
-                         torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
-                         device_map="auto" if torch.cuda.is_available() else None
-                     )
-                     
-                     if self.tokenizer.pad_token is None:
-                         self.tokenizer.pad_token = self.tokenizer.eos_token
-                         self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
-                     
-                     print(f"从本地缓存加载{self.model_size}模型成功")
-                 else:
-                     raise FileNotFoundError("本地缓存也不存在")
-                     
-             except Exception as e2:
-                 print(f"本地加载也失败: {e2}")
-                 print(f"正在下载{self.model_size}模型...")
+                 print(f"正在从HuggingFace下载{self.model_size}模型...")
                 
-                 # 创建缓存目录并下载
-                 os.makedirs(cache_dir, exist_ok=True)
-                 self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf, cache_dir=cache_dir)
+                 self.tokenizer = AutoTokenizer.from_pretrained(
+                     self.model_name_hf,
+                     force_download=True
+                 )
                 self.base_model = AutoModelForCausalLM.from_pretrained(
                     self.model_name_hf,
-                     cache_dir=cache_dir,
+                     force_download=True,
                     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                     device_map="auto" if torch.cuda.is_available() else None
                 )
@@ -110,10 +118,15 @@ class Qwen3LoRAUniversal(BaseQwenModel):
                     self.tokenizer.pad_token = self.tokenizer.eos_token
                     self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
                 
-                 # 保存到本地
-                 self.tokenizer.save_pretrained(cache_dir)
-                 self.base_model.save_pretrained(cache_dir)
-                 print(f"{self.model_size}模型下载并保存到: {cache_dir}")
+                 # 保存到本地models目录
+                 os.makedirs(local_model_dir, exist_ok=True)
+                 self.tokenizer.save_pretrained(local_model_dir)
+                 self.base_model.save_pretrained(local_model_dir)
+                 print(f"{self.model_size}模型下载并保存到: {local_model_dir}")
+                 
+             except Exception as e2:
+                 print(f"从HuggingFace下载也失败: {e2}")
+                 raise RuntimeError(f"无法加载{self.model_size}模型，所有方法都失败了")
     
     def _create_instruction_data(self, data: List[Tuple[str, int]]) -> Dataset:
         """创建指令格式的训练数据"""