use self.hidden_size not use self.fd_config.model_config.hidden_size (#7340)

zhoutianzi666 · web-flow · commit 225fc8d222d8 · 2026-04-11T22:39:43.000+08:00
diff --git a/fastdeploy/model_executor/layers/moe/moe.py b/fastdeploy/model_executor/layers/moe/moe.py
@@ -788,7 +788,7 @@ def forward_chunked_moe(
         chunk_size = self.fd_config.parallel_config.chunked_moe_size
         token_num = x.shape[0]
         fake_x = paddle.empty(
-            shape=[0, self.fd_config.model_config.hidden_size],
+            shape=[0, self.hidden_size],
             dtype=paddle.get_default_dtype(),
         )
         # input size that are less than a chunk, less than the max size data or empty input
diff --git a/tests/distributed/chunked_moe.py b/tests/distributed/chunked_moe.py
@@ -169,6 +169,8 @@ def setup_fused_moe(self):
         fused_moe.fd_config = mock_fd_config
         fused_moe.quant_method = MockQuantMethod()
         fused_moe.enable_routing_replay = None
+
+        fused_moe.hidden_size = mock_fd_config.model_config.hidden_size
         return fused_moe
 
     def run_model_runner(self):

Original file line number	Diff line number	Diff line change
`@@ -788,7 +788,7 @@ def forward_chunked_moe(`
`788`	`788`	`chunk_size = self.fd_config.parallel_config.chunked_moe_size`
`789`	`789`	`token_num = x.shape[0]`
`790`	`790`	`fake_x = paddle.empty(`
`791`		`- shape=[0, self.fd_config.model_config.hidden_size],`
	`791`	`+ shape=[0, self.hidden_size],`
`792`	`792`	`dtype=paddle.get_default_dtype(),`
`793`	`793`	`)`
`794`	`794`	`# input size that are less than a chunk, less than the max size data or empty input`