AdaptoFlux 项目简介（简洁版）

English | 中文

AdaptoFlux 项目简介（简洁版）

AdaptoFlux 是一种基于“方法池 + 路径搜索”的智能算法框架，核心思路是通过组合基础函数构造动态计算路径，以图结构（DFG）进行组织，并支持路径可解释性与结构优化。

主要特点：

使用函数池（包括 MLP、随机森林等）作为推理构件；
构建动态数据流图，实现模块化计算与路径组合；
支持自定义“坍缩函数”作为最终输出结构；
训练中结合“路径熵 + 冗余惩罚 + 指导值”进行结构调整；
可用于符号回归、小样本建模、结构搜索、逻辑组合等任务。

AdaptoFlux

一种基于方法池（包含多种类型的函数的集合）实现智能的算法

项目概述

AdaptoFlux是一种基于方法池的智能算法。不同于传统的深度学习，该算法通过生成一个基于路径的操作流程，实现智能计算和优化。通过对方法池和坍缩函数的操作，该算法拥有极强的兼容性和较强的可解释性。

进展情况

模型化简和新函数生成部分仍在开发中。
正在编写基于该算法在不修改MLP模型情况优化 MLP的示例代码，并持续优化。
正在重构ATF部分代码，使用DFG结构

未来工作

进一步优化模型化简过程，提高计算效率。
完善新函数生成机制，以增强算法适用性。
完成并优化 MLP 优化示例代码，使其更具参考价值。
载入模型后在原模型基础上训练
从模型中提取一部分已完成的路径进行重新训练
根据不同的输入数据选择不同的方法池进行路径选择，对数据分组选择不同的方法池
从当前模型中切除一块路径，记录输入数据点数和输出数据点数，重新训练一个新路径使得输入和输出和原本路径相同，以此进行优化网络
加一个方法池装饰器记录函数输入输出类型
多方法池分别处理不同的数据

如何使用

创建新的 conda 环境：

conda create -n AdaptoFlux python=3.12
conda activate AdaptoFlux

克隆仓库：

git clone https://github.com/gugugu12138/AdaptoFlux.git
cd AdaptoFlux

安装依赖：

pip install -r requirements.txt

注: 使用的方法池需要额外配置环境

修改方法池

AdaptoFlux的训练和推理基于方法池进行运行，通过修改methods.py中的函数，为AdaptoFlux提供不同的选择，达到更好的效果。 (你甚至可以往方法池里面塞随机森林和MLP模型)

数据处理模型结构说明

数据流

从输入数据到输出结果的处理过程。数据沿着动态生成的路径逐层进行特征提取和转换，每一层级执行特定的任务，并最终通过 坍缩函数 将中间表示转化为目标形式的过程。

坍缩函数

可选的转换操作，用于在基于动态生成路径的数据流处理过程中，从路径末端提取经过逐层操作后的数据，并将其转化为具有特定目标格式的输出。
具体而言，当网络中的某些值与 指导值 存在直接关系时，坍缩函数通过聚合或总结操作，将复杂的中间表示简化为更简洁的目标形式。
其输入可以是单个节点的特征向量，也可以是整个路径末端的综合数据，输出则根据任务需求定制，例如概率分布、类别标签或其他所需格式。（与方法池同理，坍缩函数可以灵活选择算法，如使用MLP作为坍缩函数）

对于长度高于2的一维纯数值数据，提供了一种通用的坍缩函数area，该函数的介绍Energy

指导值

用于指导神经的生长或退化。

指标分类与层级划分：

类别	示例指标	调整目标	影响权重
核心任务	准确率、F1分数	直接优化任务性能	高（α）
路径质量	路径熵、路径深度	保障探索与架构健康	中（β）
计算效率	内存占用、FLOPs	抑制资源浪费	低（γ）
损失控制	MSE、RMSE、交叉熵	训练初期调整优化方向，后期减少影响	变（δ）

多指标融合公式

$$ 指导值 = \sum \omega_i \cdot 核心指标_i + \sum \phi_j \cdot 路径指标_j - \sum \psi_k \cdot 效率指标_k - \delta \cdot 损失值 $$
示例计算公式：

$$ 指导值 = \alpha \cdot 准确率 + \beta \cdot 路径熵 - \gamma \cdot 冗余操作惩罚 - \delta \cdot 损失值 $$

路径熵计算

$$ 路径熵 = -\sum P(路径_i) \cdot \log P(路径_i) $$

其中，$P(路径_{\text{i}})$ 表示第 i 类路径的出现频率（统计窗口内的占比）。

冗余操作惩罚计算

$$ 冗余操作惩罚 = \sum (无效计算次数) $$

方法池（Q）

方法池是一组预定义的函数操作集合，每个方法都包含：

函数体（Function Body）
输入参数个数（Input Count）
输出参数个数（Output Count）

该池用于支持 AdaptoFlux 图模型的动态构建与优化。

函数池（F）

只包含映射函数的方法池。

动作池（O）

只包含动作函数的方法池。

$$G = \left\{ g_1, g_2, g_3, \dots, g_n \right\}$$

$$F = \left\{ f_1, f_2, f_3, \dots, f_m \right\}$$

$$O = \left\{ o_1, o_2, o_3, \dots, o_k \right\}$$

优化逻辑

生成初始模型 使用process_random_method函数生成多份指定层数的模型（这一部分不进行损失计算）（或结合replace_random_elements一定程度上优化）对比模型，选择性能最佳的初始模型。
修改初始模型图节点 对于初始模型中的每一个功能节点，从某个方向的某一层开始，逐个比较可替换的节点（输入输出维度相同的节点），对比修改节点后损失大小，选择性能最佳的节点。重复扫描多次。
生成化简模型 随机生成输入输出维度与某一部分图相同的模型，对比两者在一定范围内的输入输出，使用性能更好的模型替换图中所有相同的图，重复此流程。
生成新方法池 训练过程中，将表现优异的部分切块，迭代为新的方法池，一定轮次后使用新方法池。

模型处理流程

输入层处理
- 初始数据点数量：n
- 按照方法池规则随机分组
- 对每个分组执行对应函数
迭代处理
- 处理后将数据还原并重新分组
- 重复流程直至到达路径末端
输出生成
- 对尾部数据应用坍缩函数
- 生成最终网络输出

数据量变化公式

关键参数定义

Iₐ：函数a的输入/输出数据量比
H：每层数据期望减少比例
k：方法池函数总数
Wₐ：函数a的被选概率

核心公式

$$H = \sum_{i=1}^{k} W_i I_i$$

在不同训练阶段采用不同的方法池进行处理，可以实现对数据的扩维，修改，降维。从该公式可以发现，通过对随机选取方法的适量修改，可以很简单的控制输入和坍缩层前的维度，对于大部分激活函数都有很强的兼容性。

层间数据量关系

n₀：初始数据量
L：模型层数
nₗ：第L层数据量

$$n₀ \cdot H^L = n_L$$

路径化简

对于已经训练得到的的路径，我们可以提取出使用的方法池，生成一个该方法池可用的随机数据列表，从该数据列表中按照不同长度切割成多个二维列表，将这些二维列表作为数据进行有限制（如限制层数）无监督训练，将训练出的多个路径做对比，如输入和输出完全相同（或大部分相同），认为该两条路径等效，对它们的指标进行判断（如路径深度，运行速度等），在原路径中使用更优的路径替换掉原部分

函数池特性分析

分类定义

类型	特性	反向推导能力
双射函数池	所有函数为双射	完全可逆
单射函数池	所有函数为单射	可逆（需额外信息）
满射函数池	所有函数为满射	多输入对应单输出

特殊函数池示例

$$F = \begin{cases} f_1(a,b) = a \cdot c_1 + b \cdot d_1 \\\ f_2(a,b) = a \cdot c_2 + b \cdot d_2 \\\ \vdots \\\ f_n(a,b) = a \cdot c_n + b \cdot d_n \end{cases}$$

条件：任意一组(c,d)互质

方法池特性

组合路径数量公式

公式定义

$$ N_{\text{paths}} = \prod_{l=1}^{L} \left( |F|^{n_{l-1}} \right) $$

其中：

$N_{\text{paths}}$ ：总路径数量。
$L$ ：路径的层数（深度）。
$n_{l-1}$ ：第 $l-1$ 层的数据量（即第 $l$ 层的输入数据量）。
$|F|$ ：函数池 $F$ 的大小（可选函数数量）。

关键说明

递归性：
- 每一层的路径选择取决于前一层的输出数据量 $n_{l-1}$ 。
- 每个数据点独立选择函数，因此每层的路径分支数为 $|F|^{n_{l-1}}$ 。
示例验证：
- 案例1：1层1数据，2函数
  $N_{\text{paths}} = 2^1 = 2$ （符合：路径为 $f_1$ 或 $f_2$ ）。
- 案例2：2层1数据，2函数
  $N_{\text{paths}} = 2^1 \times 2^1 = 4$（每层2种选择，组合为4）。
- 案例3：2层2数据，2函数
  $N_{\text{paths}} = 2^2 \times 2^2 = 16$（第一层4种，第二层4种，组合为16）。
动态数据量扩展：
- 若函数可能改变数据量（如 $n_l \neq n_{l-1}$ ），需额外定义 $n_l$ 的更新规则（如 $n_l = \sum_{i=1}^{n_{l-1}} \dim_\text{out}(f_i)$ ）。

完整定义

输入：
- 初始数据量 $n_0$ 。
- 函数池 $F = {f_1, f_2, \dots, f_m}$ 。
- 路径深度 $L$ 。
输出：
- 总路径数量 $N_{\text{paths}}$ 。
约束条件：
- 所有函数输入/输出数据量为1（默认情况下）。若函数支持多输入输出，需调整公式为：

$$N_{\text{paths}} = \prod_{l=1}^{L} \left( |F|^{n_{l-1}} \times \prod_{i=1}^{n_{l-1}} \dim_\text{out}(f_i) \right)$$

示例计算

问题设定

初始数据量： $n_0 = 2$（两个独立的数据点）
函数池： $F = {f_1, f_2}$，每个函数：
- 输入：1个数据
- 输出：2个数据
层数：2层

分步计算

第1层（$l=1$）

输入数据量： $n_0 = 2$
每个数据点选择函数：
- 数据点1可选 $f_1$ 或 $f_2$（2种）
- 数据点2可选 $f_1$ 或 $f_2$（2种）
分支数： $2 \times 2 = 4$
输出数据量：每个函数输出2个数据 → 每处理1个输入，生成2个输出。 $n_1 = 2 \times 2 = 4$

第2层（$l=2$）

输入数据量： $n_1 = 4$
每个数据点选择函数：每个数据点有2种选择（$f_1$ 或 $f_2$）
分支数： $2^4 = 16$
输出数据量（可选）： $n_2 = 4 \times 2 = 8$（可继续但不影响路径数）

总路径数

第1层分支数：4
第2层分支数：16

$$ \text{总路径数} = 4 \times 16 = 64 $$

验证枚举

第1层的4种选择

$(f_1, f_1)$
$(f_1, f_2)$
$(f_2, f_1)$
$(f_2, f_2)$

每种第1层选择对应第2层的16种组合

以第1层选择 $(f_1, f_1)$ 为例：

输出数据量： $2 \times 2 = 4$
第2层选择组合数： $2^4 = 16$

例如： $(f_1, f_1, f_1, f_1)$, $(f_1, f_1, f_1, f_2)$, ... $(f_2, f_2, f_2, f_2)$

总路径数仍为：

$$ 4 \times 16 = 64 $$

一般化公式匹配

根据一般公式：

$$ N_{\text{paths}} = \prod_{l=1}^{L} |F|^{n_{l-1}} $$

第1层： $|F|^{n_0} = 2^2 = 4$
第2层： $|F|^{n_1} = 2^4 = 16$
总路径数： $4 \times 16 = 64$

与枚举结果一致 ✅

函数组合的特征维度演化

定义

背景假设我们有一个非常简化的模型，它由两个层次组成（ $L=2$ ），并且每一层都包含两种不同的函数组合方式。每个函数组合接受一定的输入并产生输出。我们的目标是计算整个模型的解空间维度和总解空间维度。

层次1

组合A: 输入维度为 2，输出维度为 3。
组合B: 输入维度为 2，输出维度为 4。

层次2

组合C: 输入维度为 3，输出维度为 5。
组合D: 输入维度为 4，输出维度为 6。

初始输入维度为 2。

解空间

解空间 是该算法能够探索的所有非等效 DFG 图所生成的输出结果的集合。

每个 DFG 图代表一种函数组合路径，但只有当其输出与其他图不同时，才被视为一个新的“解”。

示例

在给定的例子中，有四种可能的路径组合：

A → C
A → D
B → C
B → D

我们运行这些路径后得到它们的输出结果，设为：

输出1： $o_1$
输出2： $o_2$
输出3： $o_1$ （与第一条路径等效）
输出4： $o_3$

那么实际的非等效输出集合为：

$$\mathcal{O} = \left\{o_1, o_2, o_3 \right\}$$

因此，解空间的大小为：

$$|\mathcal{S}| = |\left\{o_1, o_2, o_3 \right\}| = 3$$

公式化描述

解空间定义公式

$$\mathcal{S} = \left\{ f(p) \mid p \in \mathcal{P} \right\}$$

解空间大小公式

$$ |\mathcal{S}| = \left| \bigcup_{p \in \mathcal{P}} {f(p)} \right| $$

也可以写作：

$$ |\mathcal{S}| = |\mathcal{P}| - \sum_{i=1}^{k}(n_i - 1) $$

其中：

$\mathcal{P}$ ：所有路径组合构成的集合， $\mathcal{P} = {p_1, p_2, ..., p_N}$
$f(p_i)$ ：路径 $p_i$ 对应的输出结果（可以是向量、哈希值或某种特征表示）
$|\mathcal{P}|$ ：总路径数；
$k$ ：等效类的数量（即不同输出的数量）；
$n_i$ ：第 $i$ 个等效类包含的路径数（满足 $\sum n_i = |\mathcal{P}|$ ）

应用特性

满射函数池特性

输入空间增长公式 $$T = R^C$$
- T：输入空间大小
- R：函数输入数量均值
- C：函数调用总次数

加密与压缩应用

通过添加随机变量实现单射转换
支持输出到唯一输入的映射

对无直接输入数据时

当没有直接输入时，可以通过使用一个动作池作为方法池，我们可以使用一个周期信号作为输入，通过动作池中的动作函数组合获取数据（或者使得指导函数趋向目标），以此来实现模型的构建。

（这部分理论可行，之后会把图和完整概念放上来）

应用示例

集成运算中，将各个基分类器的输出作为模型的输入，使用简单的位运算和带权运算作为方法池可结合多个分类器

Name		Name	Last commit message	Last commit date
Latest commit History 209 Commits
ATF		ATF
AdditionExample		AdditionExample
Docs		Docs
Inputless_ATF		Inputless_ATF
MLP		MLP
Test		Test
assets/images		assets/images
models		models
.gitignore		.gitignore
11%.txt		11%.txt
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
cifar10_model.keras		cifar10_model.keras
example.py		example.py
methods.py		methods.py
output.txt		output.txt
requirements.txt		requirements.txt
setup.py		setup.py

License

gugugu12138/AdaptoFlux

Folders and files

Latest commit

History

Repository files navigation

AdaptoFlux 项目简介（简洁版）

AdaptoFlux

项目概述

进展情况

未来工作

如何使用

修改方法池

数据处理模型结构说明

数据流

坍缩函数

指导值

路径熵计算

冗余操作惩罚计算

方法池（Q）

函数池（F）

动作池（O）

优化逻辑

模型处理流程

数据量变化公式

关键参数定义

层间数据量关系

路径化简

函数池特性分析

分类定义

特殊函数池示例

方法池特性

组合路径数量公式

公式定义

关键说明

完整定义

示例计算

问题设定

分步计算

第1层（$l=1$）

第2层（$l=2$）

总路径数

验证枚举

第1层的4种选择

每种第1层选择对应第2层的16种组合

一般化公式匹配

函数组合的特征维度演化

定义

层次1

层次2

解空间

公式化描述

应用特性

满射函数池特性

加密与压缩应用

对无直接输入数据时

应用示例

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages