test(processor): all processors use now the same create_transition (#1906)

* test(processor): all processors use now the same create_transition * test(processor): use identity instead of lambda for transition in pipelines
2026-05-15 16:49:55 +00:00 · 2025-09-10 18:39:06 +02:00
parent df4292f6ed
commit 51588f741b
16 changed files with 229 additions and 422 deletions
@@ -11,24 +11,10 @@ import torch
 from lerobot.configs.types import FeatureType, PipelineFeatureType, PolicyFeature
 from lerobot.constants import OBS_LANGUAGE
 from lerobot.processor import DataProcessorPipeline, TokenizerProcessorStep, TransitionKey
+from lerobot.processor.converters import create_transition, identity_transition
 from tests.utils import require_package


-def create_transition(
-    observation=None, action=None, reward=None, done=None, truncated=None, info=None, complementary_data=None
-):
-    """Helper function to create test transitions."""
-    return {
-        TransitionKey.OBSERVATION: observation,
-        TransitionKey.ACTION: action,
-        TransitionKey.REWARD: reward,
-        TransitionKey.DONE: done,
-        TransitionKey.TRUNCATED: truncated,
-        TransitionKey.INFO: info,
-        TransitionKey.COMPLEMENTARY_DATA: complementary_data,
-    }
-
-
 class MockTokenizer:
    """Mock tokenizer for testing that mimics transformers tokenizer interface."""

@@ -389,7 +375,7 @@ def test_integration_with_robot_processor(mock_auto_tokenizer):

    tokenizer_processor = TokenizerProcessorStep(tokenizer_name="test-tokenizer", max_length=6)
    robot_processor = DataProcessorPipeline(
-        [tokenizer_processor], to_transition=lambda x: x, to_output=lambda x: x
+        [tokenizer_processor], to_transition=identity_transition, to_output=identity_transition
    )

    transition = create_transition(
@@ -429,7 +415,7 @@ def test_save_and_load_pretrained_with_tokenizer_name(mock_auto_tokenizer):
    )

    robot_processor = DataProcessorPipeline(
-        [original_processor], to_transition=lambda x: x, to_output=lambda x: x
+        [original_processor], to_transition=identity_transition, to_output=identity_transition
    )

    with tempfile.TemporaryDirectory() as temp_dir:
@@ -438,7 +424,7 @@ def test_save_and_load_pretrained_with_tokenizer_name(mock_auto_tokenizer):

        # Load processor - tokenizer will be recreated from saved config
        loaded_processor = DataProcessorPipeline.from_pretrained(
-            temp_dir, to_transition=lambda x: x, to_output=lambda x: x
+            temp_dir, to_transition=identity_transition, to_output=identity_transition
        )

        # Test that loaded processor works
@@ -464,7 +450,7 @@ def test_save_and_load_pretrained_with_tokenizer_object():
    )

    robot_processor = DataProcessorPipeline(
-        [original_processor], to_transition=lambda x: x, to_output=lambda x: x
+        [original_processor], to_transition=identity_transition, to_output=identity_transition
    )

    with tempfile.TemporaryDirectory() as temp_dir:
@@ -475,8 +461,8 @@ def test_save_and_load_pretrained_with_tokenizer_object():
        loaded_processor = DataProcessorPipeline.from_pretrained(
            temp_dir,
            overrides={"tokenizer_processor": {"tokenizer": mock_tokenizer}},
-            to_transition=lambda x: x,
-            to_output=lambda x: x,
+            to_transition=identity_transition,
+            to_output=identity_transition,
        )

        # Test that loaded processor works
@@ -979,7 +965,9 @@ def test_integration_with_device_processor(mock_auto_tokenizer):
    tokenizer_processor = TokenizerProcessorStep(tokenizer_name="test-tokenizer", max_length=6)
    device_processor = DeviceProcessorStep(device="cuda:0")
    robot_processor = DataProcessorPipeline(
-        [tokenizer_processor, device_processor], to_transition=lambda x: x, to_output=lambda x: x
+        [tokenizer_processor, device_processor],
+        to_transition=identity_transition,
+        to_output=identity_transition,
    )

    # Start with CPU tensors