graph cellular automa

kyegomez · Oct 6, 2023 · bd7dbfd · bd7dbfd
1 parent 64a89c6
commit bd7dbfd
Show file tree

Hide file tree

Showing 6 changed files with 211 additions and 3 deletions.
diff --git a/nnt.py b/nnt.py
@@ -1,5 +1,5 @@
 import torch
-from swarms_torch.nnt import NNTransformer
+from swarms_torch.neuronal_transformer import NNTransformer
 
 x = torch.randn(1, 10)
 

diff --git a/swarms_torch/__init__.py b/swarms_torch/__init__.py
@@ -3,8 +3,8 @@
 from swarms_torch.queen_bee import QueenBeeGa
 from swarms_torch.spiral_optimization import SPO
 
-from swarms_torch.cen import CellularSwarm
-from swarms_torch.nnt import NNTransformer
+from swarms_torch.cellular_transformer import CellularSwarm
+from swarms_torch.neuronal_transformer import NNTransformer
 
 __all__ = [
     "ParticleSwarmOptimization",

diff --git a/swarms_torch/cen.py → swarms_torch/cellular_transformer.py b/swarms_torch/cen.py → swarms_torch/cellular_transformer.py
diff --git a/swarms_torch/graph_cellular_automa.py b/swarms_torch/graph_cellular_automa.py
@@ -0,0 +1,84 @@
+import torch
+import torch.nn as nn
+
+
+class GraphCellularAutomata(nn.Module):
+    def __init__(self, input_dim, hidden_dim, output_dim):
+        super(GraphCellularAutomata, self).__init__()
+
+        self.mlp = nn.Sequential(
+            nn.Linear(input_dim, hidden_dim),
+            nn.ReLU(),
+            nn.Linear(hidden_dim, output_dim)
+        )
+
+    def forward(self, x):
+        return self.mlp(x)
+
+
+class ReplicationModel(nn.Module):
+    def __init__(self, input_dim, hidden_dim):
+        super(ReplicationModel, self).__init__()
+
+        self.mlp = nn.Sequential(
+            nn.Linear(input_dim, hidden_dim),
+            nn.ReLU(),
+            nn.Linear(hidden_dim, 1),
+            nn.Sigmoid()  # for binary classification
+        )
+
+    def forward(self, x):
+        return self.mlp(x)
+
+class WeightUpdateModel(nn.Module):
+    def __init__(self, input_dim, hidden_dim):
+        super(WeightUpdateModel, self).__init__()
+
+        self.mlp = nn.Sequential(
+            nn.Linear(input_dim, hidden_dim),
+            nn.ReLU(),
+            nn.Linear(hidden_dim, 1)
+        )
+
+    def forward(self, x):
+        return self.mlp(x)
+
+class NDP(nn.Module):
+    def __init__(self, embedding_dim, hidden_dim):
+        super(NDP, self).__init__()
+
+        self.gc_automata = GraphCellularAutomata(embedding_dim, hidden_dim, embedding_dim)
+        self.replication_model = ReplicationModel(embedding_dim, hidden_dim)
+        self.weight_update_model = WeightUpdateModel(2 * embedding_dim, hidden_dim)
+
+    def forward(self, node_embeddings, adjacency_matrix):
+        # Update node embeddings using Graph Cellular Automata
+        updated_embeddings = self.gc_automata(node_embeddings)
+
+        # Check which nodes need to replicate
+        replication_decisions = self.replication_model(updated_embeddings)
+
+        # Weight update (assuming weighted network)
+        num_nodes = node_embeddings.shape[0]
+        edge_weights = torch.zeros((num_nodes, num_nodes))
+
+        for i in range(num_nodes):
+            for j in range(num_nodes):
+                combined_embedding = torch.cat((updated_embeddings[i], updated_embeddings[j]))
+
+                edge_weights[i, j] = self.weight_update_model(combined_embedding)
+
+        return updated_embeddings, replication_decisions, edge_weights
+
+# Usage examples
+embedding_dim = 16
+hidden_dim = 32
+node_embeddings = torch.rand((10, embedding_dim))  # For 10 nodes
+adjacency_matrix = torch.rand((10, 10))  # Dummy adjacency matrix for 10 nodes
+
+model = NDP(embedding_dim, hidden_dim)
+updated_embeddings, replication_decisions, edge_weights = model(node_embeddings, adjacency_matrix)
+
+print(updated_embeddings.shape)
+print(replication_decisions.shape)
+print(edge_weights.shape)
diff --git a/swarms_torch/nnt.py → swarms_torch/neuronal_transformer.py b/swarms_torch/nnt.py → swarms_torch/neuronal_transformer.py
diff --git a/swarms_torch/transformer_pso.py b/swarms_torch/transformer_pso.py
@@ -0,0 +1,124 @@
+import torch
+import torch.nn as nn
+from copy import deepcopy
+
+class SimpleTransformer(nn.Module):
+    def __init__(self, input_dim, d_model, nhead, num_layers, output_dim):
+        super(SimpleTransformer, self).__init__()
+        self.embedding = nn.Embedding(input_dim, d_model)
+        self.transformer = nn.Transformer(d_model, nhead, num_layers, num_layers)
+        self.fc = nn.Linear(d_model, output_dim)
+
+    def forward(self, x):
+        x = self.embedding(x)
+        x = self.transformer(x, x)
+        return self.fc(x[-1])
+
+class ParticleSwarmOptimization:
+    def __init__(
+        self, 
+        model_constructor,  # Function to create a new model instance
+        model_args,         # Arguments for the model constructor
+        device,             # 'cuda' or 'cpu'
+        criterion, 
+        data_loader, 
+        n_particles=10, 
+        inertia=0.5, 
+        personal_best_weight=1.5, 
+        global_best_weight=1.5
+    ):
+        self.model_constructor = model_constructor
+        self.model_args = model_args
+        self.criterion = criterion
+        self.data_loader = data_loader
+        self.device = device
+
+        self.n_particles = n_particles
+        self.inertia = inertia
+        self.personal_best_weight = personal_best_weight
+        self.global_best_weight = global_best_weight
+
+        # Representing particles using model parameters
+        param_size = sum(p.numel() for p in model_constructor(*model_args).parameters())
+        self.particles = [self.model_constructor(*model_args).to(device) for _ in range(n_particles)]
+        self.velocities = [torch.zeros((param_size,)).to(device) for _ in range(n_particles)]
+        self.personal_best = [deepcopy(p.state_dict()) for p in self.particles]
+        self.global_best = deepcopy(self.particles[0].state_dict())
+
+    def compute_fitness(self, model_state):
+        model = self.model_constructor(*self.model_args).to(self.device)
+        model.load_state_dict(model_state)
+        model.eval()
+
+        total_loss = 0.0
+        with torch.no_grad():
+            for inputs, targets in self.data_loader:
+                outputs = model(inputs.to(self.device))
+                loss = self.criterion(outputs, targets.to(self.device))
+                total_loss += loss.item()
+        return 1.0 / (1.0 + total_loss)
+
+    def update(self):
+        # Update particles
+        for idx, particle in enumerate(self.particles):
+            fitness = self.compute_fitness(particle.state_dict())
+
+            # Update personal best
+            if fitness > self.compute_fitness(self.personal_best[idx]):
+                self.personal_best[idx] = deepcopy(particle.state_dict())
+
+            # Update global best
+            if fitness > self.compute_fitness(self.global_best):
+                self.global_best = deepcopy(particle.state_dict())
+
+            # Update velocities and positions
+            for name, param in particle.named_parameters():
+                delta = (self.personal_best_weight * torch.rand_like(param) * 
+                         (self.personal_best[idx][name].to(self.device) - param.data) +
+                         self.global_best_weight * torch.rand_like(param) * 
+                         (self.global_best[name].to(self.device) - param.data))
+                self.velocities[idx] += self.inertia * self.velocities[idx] + delta
+                param.data += self.velocities[idx]
+
+    def optimize(self, iterations=1000):
+        for _ in range(iterations):
+            self.update()
+            best_particle_score = self.compute_fitness(self.global_best)
+            print(f"Iteration {_ + 1}/{iterations} - Best Particle Fitness: {best_particle_score}")
+
+    def get_best_model(self):
+        best_model = self.model_constructor(*self.model_args).to(self.device)
+        best_model.load_state_dict(self.global_best)
+        return best_model
+
+# Define model and optimization parameters
+input_dim = 1000
+d_model = 512
+nhead = 8
+num_layers = 3
+output_dim = 10
+
+batch_size = 32
+sequence_length = 50
+
+# Instantiate the optimizer
+pso = ParticleSwarmOptimization(
+    SimpleTransformer,
+    (input_dim, d_model, nhead, num_layers, output_dim),
+    device='cuda',  # or 'cpu'
+    criterion=nn.CrossEntropyLoss(),
+    # data_loader=your_dataloader  # replace with your dataloader
+)
+
+# Run optimization
+pso.optimize(iterations=100)
+
+# Get the best model
+best_model = pso.get_best_model()
+
+# Generate a random input tensor
+x = torch.randint(0, input_dim, (batch_size, sequence_length)).to('cuda')  # ensure it's on the same device as your model
+
+# Pass the tensor through the model
+output = best_model(x)
+print(output.shape)  # should be [batch_size, output_dim]