Fix3:Random Seed

戒酒的李白
Commit d24b47acfcb95a309a8fb24419652c31454fd7b1 d24b47ac 1 parent 26098f5a
Showing 1 changed file with 3 additions and 21 deletions
model_pro/LSTM_model.py
--- a/model_pro/LSTM_model.py
View file @d24b47a
+++ b/model_pro/LSTM_model.py
View file @d24b47a
@@ -219,15 +219,7 @@ class LSTMModelManager:
     def __init__(self, bert_model_path, model_save_path=None, vocab_size=30522, 
                  embedding_dim=100, hidden_dim=64, output_dim=2, n_layers=1, 
-                 bidirectional=True, dropout=0.3, word2vec_path=None, random_seed=42):
-        # 设置随机种子以确保可重现性
-        self.random_seed = random_seed
-        random.seed(random_seed)
-        np.random.seed(random_seed)
-        torch.manual_seed(random_seed)
-        if torch.cuda.is_available():
-            torch.cuda.manual_seed_all(random_seed)
-        
+                 bidirectional=True, dropout=0.3, word2vec_path=None):
         self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
         self.tokenizer = BertTokenizer.from_pretrained(bert_model_path)
         self.vocab_size = vocab_size
@@ -308,28 +300,18 @@ class LSTMModelManager:
         return loss + self.alpha * loss_adv
     def train_logistic_regression(self, train_texts, train_labels, val_texts=None, val_labels=None):
-        """训练逻辑回归基线模型"""
-        # 设置随机种子以确保可重现性
-        np.random.seed(self.random_seed)
-        
         vectorizer = TfidfVectorizer(max_features=5000)
         X_train = vectorizer.fit_transform(train_texts)
         if val_texts is None:
             X_train, X_val, y_train, y_val = train_test_split(
-                X_train, train_labels, test_size=0.2, 
-                stratify=train_labels, 
-                random_state=self.random_seed  # 添加随机种子
+                X_train, train_labels, test_size=0.2, stratify=train_labels
             )
         else:
             X_val = vectorizer.transform(val_texts)
             y_train, y_val = train_labels, val_labels
-        lr_model = LogisticRegression(
-            class_weight='balanced',
-            random_state=self.random_seed,  # 添加随机种子
-            max_iter=1000  # 增加最大迭代次数以确保收敛
-        )
+        lr_model = LogisticRegression(class_weight='balanced')
         lr_model.fit(X_train, y_train)
         val_pred = lr_model.predict(X_val)