fmb

  • תיאור :

מערך הנתונים שלנו מורכב מאובייקטים במראה ובגיאומטריה מגוונים. זה דורש מוטוריקה עדינה רב-שלבית ורב-מודאלית כדי להרכיב את היתדות בהצלחה על לוח לא קבוע בסצנה אקראית. אספנו בסך הכל 22,550 מסלולים על פני שתי משימות שונות על זרוע פרנקה פנדה. אנו מתעדים את המסלולים מ-2 תצוגות גלובליות ו-2 תצוגות פרק כף היד. כל תצוגה מכילה גם מפת RGB וגם מפת עומק.

לְפַצֵל דוגמאות
'train' 1,804
  • מבנה תכונה :
FeaturesDict({
    'episode_metadata': FeaturesDict({
        'episode_language_embedding': Tensor(shape=(512,), dtype=float32),
        'episode_language_instruction': string,
        'episode_task': string,
        'file_path': string,
    }),
    'steps': Dataset({
        'action': Tensor(shape=(7,), dtype=float32),
        'discount': Scalar(shape=(), dtype=float32),
        'is_first': bool,
        'is_last': bool,
        'is_terminal': bool,
        'language_embedding': Tensor(shape=(512,), dtype=float32),
        'language_instruction': string,
        'observation': FeaturesDict({
            'color_id': Scalar(shape=(), dtype=uint8),
            'eef_force': Tensor(shape=(3,), dtype=float32),
            'eef_pose': Tensor(shape=(7,), dtype=float32),
            'eef_torque': Tensor(shape=(3,), dtype=float32),
            'eef_vel': Tensor(shape=(6,), dtype=float32),
            'image_side_1': Image(shape=(256, 256, 3), dtype=uint8),
            'image_side_1_depth': Tensor(shape=(256, 256), dtype=float32),
            'image_side_2': Image(shape=(256, 256, 3), dtype=uint8),
            'image_side_2_depth': Tensor(shape=(256, 256), dtype=float32),
            'image_wrist_1': Image(shape=(256, 256, 3), dtype=uint8),
            'image_wrist_1_depth': Tensor(shape=(256, 256), dtype=float32),
            'image_wrist_2': Image(shape=(256, 256, 3), dtype=uint8),
            'image_wrist_2_depth': Tensor(shape=(256, 256), dtype=float32),
            'joint_pos': Tensor(shape=(7,), dtype=float32),
            'joint_vel': Tensor(shape=(7,), dtype=float32),
            'length': string,
            'object_id': Scalar(shape=(), dtype=uint8),
            'primitive': string,
            'shape_id': Scalar(shape=(), dtype=uint8),
            'size': string,
            'state_gripper_pose': Scalar(shape=(), dtype=float32),
        }),
        'reward': Scalar(shape=(), dtype=float32),
    }),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
episode_metadata FeaturesDict
episode_metadata/episode_language_embedding מוֹתֵחַ (512,) לצוף32
episode_metadata/episode_language_instruction מוֹתֵחַ חוּט
episode_metadata/episode_task מוֹתֵחַ חוּט
episode_metadata/file_path מוֹתֵחַ חוּט
צעדים מערך נתונים
צעדים/פעולה מוֹתֵחַ (7,) לצוף32
צעדים/הנחה סקלר לצוף32
צעדים/הוא_ראשון מוֹתֵחַ bool
צעדים/הוא_אחרון מוֹתֵחַ bool
steps/is_terminal מוֹתֵחַ bool
שלבים/הטבעת_שפה מוֹתֵחַ (512,) לצוף32
שלבים/הוראת_שפה מוֹתֵחַ חוּט
צעדים/תצפית FeaturesDict
steps/observation/color_id סקלר uint8
צעדים/תצפית/eef_force מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/eef_pose מוֹתֵחַ (7,) לצוף32
צעדים/תצפית/eef_torque מוֹתֵחַ (3,) לצוף32
צעדים/תצפית/eef_vel מוֹתֵחַ (6,) לצוף32
צעדים/תצפית/צד_תמונה_1 תמונה (256, 256, 3) uint8
צעדים/תצפית/תמונה_צד_1_עומק מוֹתֵחַ (256, 256) לצוף32
צעדים/תצפית/צד_תמונה_2 תמונה (256, 256, 3) uint8
צעדים/תצפית/תמונה_צד_2_עומק מוֹתֵחַ (256, 256) לצוף32
צעדים/תצפית/תמונה_יד_1 תמונה (256, 256, 3) uint8
צעדים/תצפית/תמונה_שורש כף היד_1_עומק מוֹתֵחַ (256, 256) לצוף32
צעדים/תצפית/תמונה_יד_2 תמונה (256, 256, 3) uint8
צעדים/תצפית/תמונה_שורש כף היד_2_עומק מוֹתֵחַ (256, 256) לצוף32
צעדים/תצפית/מפרק_פוז מוֹתֵחַ (7,) לצוף32
צעדים/תצפית/מפרקים מוֹתֵחַ (7,) לצוף32
צעדים/תצפית/אורך מוֹתֵחַ חוּט
steps/observation/object_id סקלר uint8
צעדים/התבוננות/פרימיטיביים מוֹתֵחַ חוּט
צעדים/תצפית/מזהה_צורה סקלר uint8
צעדים/תצפית/גודל מוֹתֵחַ חוּט
צעדים/תצפית/מצב_תופס_תפוס סקלר לצוף32
צעדים/פרס סקלר לצוף32
  • ציטוט :
https://doi.org/10.48550/arXiv.2401.08553