Optimize the model loading logic of Qwen3.

戒酒的李白
Commit ad27791e1c98d528d5e4623245b32c124959130f ad27791e 1 parent c4af1eff
Showing 3 changed files with 96 additions and 64 deletions
WeiboSentiment_SmallQwen/predict_universal.py
WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
WeiboSentiment_SmallQwen/qwen3_lora_universal.py
--- a/WeiboSentiment_SmallQwen/predict_universal.py
View file @ad27791
+++ b/WeiboSentiment_SmallQwen/predict_universal.py
View file @ad27791
@@ -37,11 +37,14 @@ class Qwen3UniversalPredictor:
             raise ValueError(f"不支持的模型大小: {model_size}")
         model_path = MODEL_PATHS[model_type][model_size]
+        model_key = self._get_model_key(model_type, model_size)
+        
+        # 检查训练好的模型文件是否存在
         if not os.path.exists(model_path):
-            print(f"模型文件不存在: {model_path}")
+            print(f"训练好的模型文件不存在: {model_path}")
+            print(f"请先训练 {model_type.upper()}-{model_size} 模型，或检查模型路径配置")
             return
-        model_key = self._get_model_key(model_type, model_size)
         print(f"加载 {model_type.upper()}-{model_size} 模型...")
         try:
@@ -60,6 +63,7 @@ class Qwen3UniversalPredictor:
         except Exception as e:
             print(f"加载 {model_type.upper()}-{model_size} 模型失败: {e}")
+            print(f"这可能是因为基础模型下载失败或训练好的模型文件损坏")
     def load_all_models(self, model_dir: str = './models') -> None:
         """加载所有可用的模型"""
--- a/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
View file @ad27791
+++ b/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
View file @ad27791
@@ -103,46 +103,61 @@ class Qwen3EmbeddingUniversal(BaseQwenModel):
         """加载Qwen3 Embedding模型"""
         print(f"加载{self.model_size}模型: {self.model_name_hf}")
+        # 第一步：检查当前文件夹的models目录
+        local_model_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
+        if os.path.exists(local_model_dir) and os.path.exists(os.path.join(local_model_dir, "config.json")):
             try:
+                print(f"发现本地模型，从本地加载: {local_model_dir}")
+                self.tokenizer = AutoTokenizer.from_pretrained(local_model_dir)
+                self.embedding_model = AutoModel.from_pretrained(local_model_dir).to(self.device)
+                print(f"从本地模型加载{self.model_size}模型成功")
+                return
+                
+            except Exception as e:
+                print(f"本地模型加载失败: {e}")
+        
+        # 第二步：检查HuggingFace缓存
+        try:
+            from transformers.utils import default_cache_path
+            cache_path = default_cache_path
+            print(f"检查HuggingFace缓存: {cache_path}")
+            
             self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
             self.embedding_model = AutoModel.from_pretrained(self.model_name_hf).to(self.device)
-            print(f"{self.model_size}模型加载完成")
+            print(f"从HuggingFace缓存加载{self.model_size}模型成功")
-            # 立即保存到本地缓存
-            cache_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
-            if not os.path.exists(cache_dir):
-                print(f"保存模型到本地: {cache_dir}")
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer.save_pretrained(cache_dir)
-                self.embedding_model.save_pretrained(cache_dir)
-                print(f"模型已保存到: {cache_dir}")
+            # 保存到本地models目录
+            print(f"保存模型到本地: {local_model_dir}")
+            os.makedirs(local_model_dir, exist_ok=True)
+            self.tokenizer.save_pretrained(local_model_dir)
+            self.embedding_model.save_pretrained(local_model_dir)
+            print(f"模型已保存到: {local_model_dir}")
         except Exception as e:
-            print(f"从Hugging Face加载失败: {e}")
+            print(f"从HuggingFace缓存加载失败: {e}")
-            # 尝试从本地缓存加载
-            cache_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
+            # 第三步：从HuggingFace下载
             try:
-                if os.path.exists(cache_dir):
-                    self.tokenizer = AutoTokenizer.from_pretrained(cache_dir)
-                    self.embedding_model = AutoModel.from_pretrained(cache_dir).to(self.device)
-                    print(f"从本地缓存加载{self.model_size}模型成功")
-                else:
-                    raise FileNotFoundError("本地缓存也不存在")
+                print(f"正在从HuggingFace下载{self.model_size}模型...")
+                
+                self.tokenizer = AutoTokenizer.from_pretrained(
+                    self.model_name_hf,
+                    force_download=True
+                )
+                self.embedding_model = AutoModel.from_pretrained(
+                    self.model_name_hf,
+                    force_download=True
+                ).to(self.device)
+                
+                # 保存到本地models目录
+                os.makedirs(local_model_dir, exist_ok=True)
+                self.tokenizer.save_pretrained(local_model_dir)
+                self.embedding_model.save_pretrained(local_model_dir)
+                print(f"{self.model_size}模型下载并保存到: {local_model_dir}")
             except Exception as e2:
-                print(f"本地加载也失败: {e2}")
-                print(f"正在下载{self.model_size}模型...")
-                
-                # 创建缓存目录并下载
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf, cache_dir=cache_dir)
-                self.embedding_model = AutoModel.from_pretrained(self.model_name_hf, cache_dir=cache_dir).to(self.device)
-                
-                # 保存到本地
-                self.tokenizer.save_pretrained(cache_dir)
-                self.embedding_model.save_pretrained(cache_dir)
-                print(f"{self.model_size}模型下载并保存到: {cache_dir}")
+                print(f"从HuggingFace下载也失败: {e2}")
+                raise RuntimeError(f"无法加载{self.model_size}模型，所有方法都失败了")
     def train(self, train_data: List[Tuple[str, int]], **kwargs) -> None:
         """训练模型"""
--- a/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
View file @ad27791
+++ b/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
View file @ad27791
@@ -46,10 +46,14 @@ class Qwen3LoRAUniversal(BaseQwenModel):
         """加载Qwen3基础模型"""
         print(f"加载{self.model_size}基础模型: {self.model_name_hf}")
+        # 第一步：检查当前文件夹的models目录
+        local_model_dir = f"./models/qwen3-{self.model_size.lower()}"
+        if os.path.exists(local_model_dir) and os.path.exists(os.path.join(local_model_dir, "config.json")):
             try:
-            self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
+                print(f"发现本地模型，从本地加载: {local_model_dir}")
+                self.tokenizer = AutoTokenizer.from_pretrained(local_model_dir)
                 self.base_model = AutoModelForCausalLM.from_pretrained(
-                self.model_name_hf,
+                    local_model_dir,
                     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                     device_map="auto" if torch.cuda.is_available() else None
                 )
@@ -59,49 +63,53 @@ class Qwen3LoRAUniversal(BaseQwenModel):
                     self.tokenizer.pad_token = self.tokenizer.eos_token
                     self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
-            print(f"{self.model_size}基础模型加载完成")
-            
-            # 立即保存到本地缓存
-            cache_dir = f"./models/qwen3-{self.model_size.lower()}"
-            if not os.path.exists(cache_dir):
-                print(f"保存模型到本地: {cache_dir}")
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer.save_pretrained(cache_dir)
-                self.base_model.save_pretrained(cache_dir)
-                print(f"模型已保存到: {cache_dir}")
+                print(f"从本地模型加载{self.model_size}基础模型成功")
+                return
             except Exception as e:
-            print(f"从Hugging Face加载失败: {e}")
+                print(f"本地模型加载失败: {e}")
-            # 尝试从本地缓存加载
-            cache_dir = f"./models/qwen3-{self.model_size.lower()}"
+        # 第二步：检查HuggingFace缓存
         try:
-                if os.path.exists(cache_dir):
-                    self.tokenizer = AutoTokenizer.from_pretrained(cache_dir)
+            from transformers.utils import default_cache_path
+            cache_path = default_cache_path
+            print(f"检查HuggingFace缓存: {cache_path}")
+            
+            self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
             self.base_model = AutoModelForCausalLM.from_pretrained(
-                        cache_dir,
+                self.model_name_hf,
                 torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                 device_map="auto" if torch.cuda.is_available() else None
             )
+            # 设置pad_token
             if self.tokenizer.pad_token is None:
                 self.tokenizer.pad_token = self.tokenizer.eos_token
                 self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
-                    print(f"从本地缓存加载{self.model_size}模型成功")
-                else:
-                    raise FileNotFoundError("本地缓存也不存在")
+            print(f"从HuggingFace缓存加载{self.model_size}基础模型成功")
-            except Exception as e2:
-                print(f"本地加载也失败: {e2}")
-                print(f"正在下载{self.model_size}模型...")
+            # 保存到本地models目录
+            print(f"保存模型到本地: {local_model_dir}")
+            os.makedirs(local_model_dir, exist_ok=True)
+            self.tokenizer.save_pretrained(local_model_dir)
+            self.base_model.save_pretrained(local_model_dir)
+            print(f"模型已保存到: {local_model_dir}")
-                # 创建缓存目录并下载
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf, cache_dir=cache_dir)
+        except Exception as e:
+            print(f"从HuggingFace缓存加载失败: {e}")
+            
+            # 第三步：从HuggingFace下载
+            try:
+                print(f"正在从HuggingFace下载{self.model_size}模型...")
+                
+                self.tokenizer = AutoTokenizer.from_pretrained(
+                    self.model_name_hf,
+                    force_download=True
+                )
                 self.base_model = AutoModelForCausalLM.from_pretrained(
                     self.model_name_hf,
-                    cache_dir=cache_dir,
+                    force_download=True,
                     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                     device_map="auto" if torch.cuda.is_available() else None
                 )
@@ -110,10 +118,15 @@ class Qwen3LoRAUniversal(BaseQwenModel):
                     self.tokenizer.pad_token = self.tokenizer.eos_token
                     self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
-                # 保存到本地
-                self.tokenizer.save_pretrained(cache_dir)
-                self.base_model.save_pretrained(cache_dir)
-                print(f"{self.model_size}模型下载并保存到: {cache_dir}")
+                # 保存到本地models目录
+                os.makedirs(local_model_dir, exist_ok=True)
+                self.tokenizer.save_pretrained(local_model_dir)
+                self.base_model.save_pretrained(local_model_dir)
+                print(f"{self.model_size}模型下载并保存到: {local_model_dir}")
+                
+            except Exception as e2:
+                print(f"从HuggingFace下载也失败: {e2}")
+                raise RuntimeError(f"无法加载{self.model_size}模型，所有方法都失败了")
     def _create_instruction_data(self, data: List[Tuple[str, int]]) -> Dataset:
         """创建指令格式的训练数据"""