20 |
0.1🌟 |
自定义算子 masked_per_token_quant 单测补充 |
@ooooo-create #4111
|
@ooooo-create |
21 |
0.1🌟 |
自定义算子 moe_fused_hadamard_quant_fp8 单测补充 |
@ooooo-create #4094
|
@ooooo-create |
22 |
0.1🌟 |
自定义算子 share_external_data 单测补充 |
@ddsfda99 @ooooo-create #3744
|
@ooooo-create |
23 |
0.1🌟 |
自定义算子 fused_hadamard_quant_fp8 单测补充 |
@ooooo-create #4094
|
@ooooo-create |
24 |
0.1🌟 |
自定义算子 rebuild_padding 单测补充 |
@co63oc #4107
|
@co63oc |
25 |
0.1🌟 |
自定义算子 fused_get_rotary_embedding 单测补充 |
@Echo-Nie #3892
|
@Echo-Nie |
26 |
0.1🌟 |
自定义算子 set_value_by_flags_and_idx 单测补充 |
@ooooo-create #3738 @Echo-Nie #4186
|
@Echo-Nie |
27 |
0.1🌟 |
自定义算子 get_padding_offset 单测补充 |
@co63oc #3708
|
@co63oc |
28 |
0.1🌟 |
自定义算子 cutlass_fp8_fp8_fp8_dual_gemm_fused 单测补充 |
@WanRui37 #3935
|
@WanRui37 |
29 |
0.1🌟 |
自定义算子 cutlass_fp8_fp8_half_block_gemm_fused 单测补充 |
@ooooo-create #4096
|
|
30 |
0.1🌟 |
自定义算子 tritonmoe_preprocess 单测补充 |
@Echo-Nie #3891
|
@Echo-Nie |
31 |
0.1🌟 |
自定义算子 gptq_marlin_repack 单测补充 |
@wandering-tiger
|
|
32 |
0.1🌟 |
自定义算子 group_swiglu_with_masked 单测补充 |
@ooooo-create #3748
|
@ooooo-create |
33 |
0.1🌟 |
自定义算子 moe_wna16_marlin_gemm 单测补充 |
@wandering-tiger
|
|
34 |
0.1🌟 |
自定义算子 get_position_ids_and_mask_encoder_batch 单测补充 |
@Echo-Nie #3739
|
@Echo-Nie |
35 |
0.1🌟 |
自定义算子 masked_per_token_quant 单测补充 |
@Echo-Nie #3867
|
@Echo-Nie |
36 |
0.1🌟 |
自定义算子 extract_text_token_output 单测补充 |
@ddsfda99 @Echo-Nie #3862
|
@Echo-Nie |
37 |
0.1🌟 |
自定义算子 top_k_renorm_probs 单测补充 |
@Echo-Nie #3755
|
@Echo-Nie |
38 |
0.1🌟 |
自定义算子 winx_unzip 单测补充 |
@Echo-Nie #3910
|
|
39 |
0.1🌟 |
自定义算子 moe_expert_ffn_wint2 单测补充 |
|
|
40 |
0.1🌟 |
自定义算子 top_p_candidates 单测补充 |
@co63oc #4046
|
@co63oc |
41 |
0.1🌟 |
自定义算子 speculate_update_v2 单测补充 |
@co63oc #3940
|
@co63oc |
42 |
0.1🌟 |
自定义算子 speculate_get_output_padding_offset 单测补充 |
@co63oc #3740
|
@co63oc |
43 |
0.1🌟 |
自定义算子 speculate_get_seq_lens_output 单测补充 |
@co63oc #3730
|
@co63oc |
44 |
0.1🌟 |
自定义算子 speculate_get_token_penalty_multi_scores 单测补充 |
@co63oc #3742
|
@co63oc |
45 |
0.1🌟 |
自定义算子 speculate_get_padding_offset 单测补充 |
@co63oc #3730
|
@co63oc |
46 |
0.1🌟 |
自定义算子 fused_rotary_position_encoding 单测补充 |
@Echo-Nie #3848
|
@Echo-Nie |
47 |
0.1🌟 |
自定义算子 append_attention 单测补充 |
|
|
48 |
0.1🌟 |
自定义算子 ep_moe_expert_dispatch_fp8 单测补充 |
@G2uge #4426
|
|
49 |
0.1🌟 |
自定义算子 pre_cache_len_concat 单测补充 |
@Echo-Nie #3847
|
@Echo-Nie |
50 |
0.1🌟 |
自定义算子 ep_moe_expert_dispatch 单测补充 |
@G2uge #4422
|
|
51 |
0.1🌟 |
自定义算子 masked_per_token_quant 单测补充 |
|
|
52 |
0.1🌟 |
自定义算子 dynamic_per_token_scaled_fp8_quant 单测补充 |
@co63oc #4015
|
@co63oc |
53 |
0.1🌟 |
自定义算子 multi_head_latent_attention 单测补充 |
@co63oc @playasdw #4328
|
|
54 |
0.1🌟 |
自定义算子 per_token_quant 单测补充 |
@ooooo-create #3746
|
@ooooo-create |
55 |
0.1🌟 |
自定义算子 update_inputs_v1 单测补充 |
@co63oc #3992
|
@co63oc |
56 |
0.1🌟 |
自定义算子 get_data_ptr_ipc 单测补充 |
@ooooo-create #3744 #3874
|
|
57 |
0.1🌟 |
自定义算子 per_token_quant_padding 单测补充 |
@ooooo-create #3746
|
@ooooo-create |
58 |
0.1🌟 |
自定义算子 speculate_rebuild_append_padding 单测补充 |
|
|
59 |
0.1🌟 |
自定义算子 speculate_set_value_by_flags_and_idx 单测补充 |
@ooooo-create #3738
|
|
60 |
0.1🌟 |
自定义算子 eagle_get_self_hidden_states 单测补充 |
@co63oc #3876
|
@co63oc |
61 |
0.1🌟 |
自定义算子 speculate_update_v3 单测补充 |
@co63oc #3875 #3940
|
@co63oc |
62 |
0.1🌟 |
自定义算子 eagle_get_hidden_states 单测补充 |
@co63oc #3876
|
@co63oc |
63 |
0.1🌟 |
自定义算子 draft_model_postprocess 单测补充 |
@co63oc #3757
|
@co63oc |
64 |
0.1🌟 |
自定义算子 draft_model_set_value_by_flags 单测补充 |
@Echo-Nie #3741
|
@Echo-Nie |
65 |
0.1🌟 |
自定义算子 draft_model_update 单测补充 |
@co63oc #3940
|
@co63oc |
66 |
0.1🌟 |
自定义算子 speculate_set_stop_value_multi_seqs 单测补充 |
@co63oc #3941
|
@co63oc |
67 |
0.1🌟 |
自定义算子 speculate_verify 单测补充 |
@co63oc #4326
|
@co63oc |
68 |
0.1🌟 |
自定义算子 ngram_match 单测补充 |
@Echo-Nie #3732
|
@Echo-Nie |
69 |
0.1🌟 |
自定义算子 draft_model_preprocess 单测补充 |
@co63oc #3832
|
@co63oc |
70 |
0.1🌟 |
功能模块 CUDAPlatform、CPUPlatform 单测补充 |
@Echo-Nie #3580
|
@Echo-Nie |
71 |
0.1🌟 |
功能模块 WeightOnlyLinearMethod 单测补充 |
@Echo-Nie #4109
|
|
72 |
0.1🌟 |
功能模块 Worker/ModelRunner 单测补充 |
@Echo-Nie #3576
|
|
73 |
0.1🌟 |
功能模块 graph_optimization 单测补充 |
@ooooo-create #3609
|
@ooooo-create |
74 |
0.1🌟 |
功能模块 fastdeploy/cache_manager/RDMACommManager 单测补充 |
|
|
75 |
0.1🌟 |
功能模块 fastdeploy/cache_manager/IPCCommManager 单测补充 |
|
|
76 |
0.1🌟 |
功能模块 fastdeploy/model_executor/guided_decoding/XGrammarChecker 单测补充 |
@Echo-Nie #3560 #4075
|
|
77 |
0.1🌟 |
功能模块 fastdeploy/metrics/metrics/get_filtered_metrics 单测补充 |
@Echo-Nie #3578
|
@Echo-Nie |
78 |
0.1🌟 |
功能模块 fastdeploy/entrypoints 单测补充 |
@co63oc #3958
|
@co63oc |
79 |
0.1🌟 |
功能模块 fastdeploy/entrypoints/openai 单测补充 |
@playasdw #4281 #4327
|
|
80 |
0.1🌟 |
功能模块 fastdeploy/splitwise 单测补充 |
|
|
81 |
0.1🌟 |
功能模块 fastdeploy/output 单测补充 |
@xilzy
|
|
82 |
0.1🌟 |
功能模块 fastdeploy/cache_manager 单测补充 |
@Echo-Nie #3737
|
|
83 |
0.1🌟 |
功能模块 fastdeploy/model_executor/models 单测补充 |
|
|
84 |
0.1🌟 |
功能模块 fastdeploy/reasoning/ 单测补充 |
@Echo-Nie #3570
|
@Echo-Nie |
85 |
0.1🌟 |
功能模块 fastdeploy/inputs/ 单测补充 |
@xilzy
|
|
86 |
⭐⭐ |
FastDeploy编译加速 |
@ccsuzzh #1153 #4256 #4330 #4383
|
|
87 |
⭐⭐ |
为FastDeploy增加Profiler模块 |
|
|
88 |
⭐⭐ |
为FastDeploy重构log日志打印范式 |
|
|
89 |
⭐⭐ |
为FastDeploy集成 SageAttn v2/2++ |
@WanRui37 @fangfangssj #1157
|
|
90 |
⭐⭐ |
为FastDeploy集成 SpargeAttn |
@fangfangssj @Le-soleile
|
|
91 |
⭐⭐ |
FastDeploy中的MoE GroupGEMM支持INT8*INT8实现 |
@WanRui37 #1164
|
|
92 |
⭐⭐ |
为 FastDeploy 新增 K2模型 |
@ZhijunLStudio
|
|
93 |
⭐⭐ |
为 FastDeploy 新增 MiniMax-M1模型 |
@ZhijunLStudio #4095 #1156 #4409
|
|
94 |
⭐⭐⭐ |
为 FastDeploy 新增 SD、Flux扩散模型 |
@ZhijunLStudio @kitalkuyo-gita #75151 #4021
|
|
95 |
⭐⭐ |
为 FastDeploy 新增 MTP 的 Multi-layer功能 |
@xiaohajiayou
|
|
96 |
⭐⭐⭐ |
为FastDeploy新增MLA的FP8版本实现 |
|
|