refactor(rl): expose public API in rl/__init__ and use relative imports in sub-packages

2026-07-24 10:16:09 +00:00 · 2026-04-16 15:46:34 +02:00
parent a5ad273b62
commit d7e25c8326
5 changed files with 25 additions and 15 deletions
@@ -16,19 +16,29 @@
 Reinforcement learning modules.
 Requires: ``pip install 'lerobot[hilserl]'``
 Available modules (import directly)::
    from lerobot.rl.actor import ...
    from lerobot.rl.learner import ...
    from lerobot.rl.learner_service import ...
    from lerobot.rl.buffer import ...
    from lerobot.rl.eval_policy import ...
    from lerobot.rl.gym_manipulator import ...
 """
 from lerobot.utils.import_utils import require_package
 require_package("grpcio", extra="hilserl", import_name="grpc")
-__all__: list[str] = []
+from .algorithms.base import RLAlgorithm as RLAlgorithm
 from .algorithms.configs import RLAlgorithmConfig as RLAlgorithmConfig, TrainingStats as TrainingStats
 from .algorithms.factory import make_algorithm as make_algorithm
 from .algorithms.sac import SACAlgorithm as SACAlgorithm, SACAlgorithmConfig as SACAlgorithmConfig
 from .buffer import ReplayBuffer as ReplayBuffer
 from .data_sources import DataMixer as DataMixer, OnlineOfflineMixer as OnlineOfflineMixer
 from .trainer import RLTrainer as RLTrainer
 __all__ = [
    "RLAlgorithm",
    "RLAlgorithmConfig",
    "TrainingStats",
    "make_algorithm",
    "SACAlgorithm",
    "SACAlgorithmConfig",
    "RLTrainer",
    "ReplayBuffer",
    "DataMixer",
    "OnlineOfflineMixer",
 ]
@@ -12,7 +12,7 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
-from lerobot.rl.algorithms.sac import SACAlgorithm as SACAlgorithm, SACAlgorithmConfig as SACAlgorithmConfig
+from .sac import SACAlgorithm as SACAlgorithm, SACAlgorithmConfig as SACAlgorithmConfig
 __all__ = [
    "SACAlgorithm",
@@ -12,6 +12,6 @@
 # See the License for the specific language governing permissions and
 # limitations under the License.
-from lerobot.rl.data_sources.data_mixer import BatchType, DataMixer, OnlineOfflineMixer
+from .data_mixer import BatchType, DataMixer, OnlineOfflineMixer
 __all__ = ["BatchType", "DataMixer", "OnlineOfflineMixer"]
@@ -22,9 +22,9 @@ import pytest
 pytest.importorskip("grpc")
-from torch.multiprocessing import Queue as TorchMPQueue  # noqa: E402
+from torch.multiprocessing import Queue as TorchMPQueue
-from lerobot.rl.queue import get_last_item_from_queue  # noqa: E402
+from lerobot.rl.queue import get_last_item_from_queue
 def test_get_last_item_single_item():
@@ -24,7 +24,7 @@ import pytest
 pytest.importorskip("grpc")
-from lerobot.rl.process import ProcessSignalHandler  # noqa: E402
+from lerobot.rl.process import ProcessSignalHandler
 # Fixture to reset shutdown_event_counter and original signal handlers before and after each test