1. HDFS (Hadoop Distributed File System)

Как это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚
HDFS β€” это распрСдСлСнная файловая систСма, прСдназначСнная для хранСния Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° кластСрС машин, оптимизированная для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ….
Она Π΄Π΅Π»ΠΈΡ‚ Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° Π±Π»ΠΎΠΊΠΈ (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ Ρ€Π°Π·ΠΌΠ΅Ρ€ Π±Π»ΠΎΠΊΠ° β€” 128 ΠœΠ‘) ΠΈ Ρ€Π΅ΠΏΠ»ΠΈΡ†ΠΈΡ€ΡƒΠ΅Ρ‚ эти Π±Π»ΠΎΠΊΠΈ Π½Π° нСсколько ΡƒΠ·Π»ΠΎΠ² для обСспСчСния отказоустойчивости.
ИдСально ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ² β€œΠΏΠΈΡˆΠ΅ΠΌ ΠΎΠ΄ΠΈΠ½ Ρ€Π°Π·, Ρ‡ΠΈΡ‚Π°Π΅ΠΌ ΠΌΠ½ΠΎΠ³ΠΎ раз” с большими Ρ„Π°ΠΉΠ»Π°ΠΌΠΈ.
HDFS Π»ΡƒΡ‡ΡˆΠ΅ всСго Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² связкС с Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ°ΠΌΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° основС Hadoop, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ Hive ΠΈ Spark.

Π’ΠΈΠΏΠΈΡ‡Π½Ρ‹Π΅ случаи использования

  • ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… инструмСнтами Hadoop (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Spark).
  • Аналитика, процСссы машинного обучСния.
  • Π₯Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π° Π΄Π°Π½Π½Ρ‹Ρ… для хранСния Π½Π΅ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½Ρ‹Ρ…, нСструктурированных Π΄Π°Π½Π½Ρ‹Ρ….

Π£ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ доступом Π² HDFS
HDFS прСдоставляСт нСсколько ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΠΎΠ² для контроля доступа ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ:

  1. Π€Π°ΠΉΠ»ΠΎΠ²Ρ‹Π΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ (модСль POSIX)
    Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ POSIX: Ρ‡Ρ‚Π΅Π½ΠΈΠ΅, запись, Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ для ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ, Π³Ρ€ΡƒΠΏΠΏ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΡ….
    Π Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΡƒΠΏΡ€Π°Π²Π»ΡΡŽΡ‚ΡΡ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΡΡƒΠΏΠ΅Ρ€ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Ρ Hadoop ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄ Ρ‚ΠΈΠΏΠ° hdfs dfs -chmod ΠΈ hdfs dfs -chown.

  2. АутСнтификация Kerberos
    Kerberos ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для Π°ΡƒΡ‚Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΈ сСрвисов, ΠΎΠ±Ρ€Π°Ρ‰Π°ΡŽΡ‰ΠΈΡ…ΡΡ ΠΊ HDFS.

  3. Бписки контроля доступа (ACL)
    ACL ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Π±ΠΎΠ»Π΅Π΅ Ρ‚ΠΎΡ‡Π½Ρ‹ΠΉ ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ Π½Π°Π΄ доступом ΠΊ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ Ρ„Π°ΠΉΠ»Π°ΠΌ ΠΈΠ»ΠΈ ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³Π°ΠΌ.
    ΠŸΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ‚ администраторам Π·Π°Π΄Π°Π²Π°Ρ‚ΡŒ явныС Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ для ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ/Π³Ρ€ΡƒΠΏΠΏ свСрх Π±Π°Π·ΠΎΠ²Ρ‹Ρ… POSIX-ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠΉ.

  4. Apache Ranger
    Apache Ranger прСдоставляСт Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠ΅ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡ‚ΡŒΡŽ.

    ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ доступом Π½Π° основС Ρ€ΠΎΠ»Π΅ΠΉ (RBAC) ΠΈ Π΄Π΅Ρ‚Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ Π°Π²Ρ‚ΠΎΡ€ΠΈΠ·Π°Ρ†ΠΈΠΈ для управлСния доступом.

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ с Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡ‚ΡŒΡŽ HDFS

  • Настройка Kerberos ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ слоТной, особСнно Π² ΠΊΡ€ΡƒΠΏΠ½Ρ‹Ρ… срСдах.
  • Π£ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡΠΌΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ Π³Ρ€ΠΎΠΌΠΎΠ·Π΄ΠΊΠΈΠΌ с большим числом ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ.
  • Π“Ρ€Π°Π½ΡƒΠ»ΡΡ€Π½ΠΎΡΡ‚ΡŒ контроля доступа ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π° модСлью Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ POSIX.

2. On-Prem S3 (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, MinIO)

Как это Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚
MinIO β€” это ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½Π°Ρ систСма хранСния, совмСстимая с S3. Она ΠΈΠΌΠΈΡ‚ΠΈΡ€ΡƒΠ΅Ρ‚ API S3, позволяя Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ Π² Π²ΠΈΠ΄Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² (ΠΏΠ°Ρ€ ΠΊΠ»ΡŽΡ‡-Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅) Π² распрСдСлСнной Ρ„ΠΎΡ€ΠΌΠ΅.
Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π° локальном ΠΎΠ±ΠΎΡ€ΡƒΠ΄ΠΎΠ²Π°Π½ΠΈΠΈ ΠΈ ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ Ρ‚Π΅ ΠΆΠ΅ возмоТности, Ρ‡Ρ‚ΠΎ ΠΈ ΠΎΠ±Π»Π°Ρ‡Π½Ρ‹Π΅ сСрвисы S3, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ Amazon S3.

Π’ΠΈΠΏΠΈΡ‡Π½Ρ‹Π΅ случаи использования

  • Π₯Ρ€Π°Π½Π΅Π½ΠΈΠ΅ Ρ€Π΅Π·Π΅Ρ€Π²Π½Ρ‹Ρ… ΠΈ Π°Ρ€Ρ…ΠΈΠ²Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π½Π° локальном ΠΎΠ±ΠΎΡ€ΡƒΠ΄ΠΎΠ²Π°Π½ΠΈΠΈ.
  • Π₯Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π° Π΄Π°Π½Π½Ρ‹Ρ…, Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ° Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ….
  • Π₯остинг статичных Ρ„Π°ΠΉΠ»ΠΎΠ², ΠΌΠ΅Π΄ΠΈΠ°Ρ„Π°ΠΉΠ»ΠΎΠ² ΠΈΠ»ΠΈ Π»ΠΎΠ³ΠΎΠ² Π² ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… срСдах.
  • Π˜Π½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡ с инструмСнтами для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Apache Spark).

Π£ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ доступом Π² On-Prem S3 (MinIO)
MinIO ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ доступом Π½Π° основС ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊ (PBAC).

  1. ΠŸΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ для Π±Π°ΠΊΠ΅Ρ‚Π°, IAM
    ΠŸΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ для Π±Π°ΠΊΠ΅Ρ‚Π° ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π½Π° доступ Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ Π±Π°ΠΊΠ΅Ρ‚Π° ΠΈ Π·Π°ΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚ΡΡ Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ JSON, указывая дСйствия ΠΈ условия (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, s3:GetObject).
    IAM Ρ€ΠΎΠ»ΠΈ/ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΠΈ: доступ управляСтся ΠΏΡƒΡ‚Π΅ΠΌ создания ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΈ Ρ€ΠΎΠ»Π΅ΠΉ с ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΌΠΈ Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡΠΌΠΈ. Π­Ρ‚ΠΈ Ρ€ΠΎΠ»ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ ΠΏΠΎΠ»Π½Ρ‹ΠΉ доступ, доступ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ для чтСния ΠΈΠ»ΠΈ Π±ΠΎΠ»Π΅Π΅ спСцифичСский доступ Π² зависимости ΠΎΡ‚ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ.

  2. Π¨ΠΈΡ„Ρ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΈ бСзопасный доступ
    MinIO ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ сСрвСрноС ΡˆΠΈΡ„Ρ€ΠΎΠ²Π°Π½ΠΈΠ΅ (SSE) для Π·Π°Ρ‰ΠΈΡ‚Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ….
    Доступ Π·Π°Ρ‰ΠΈΡ‰Π΅Π½ HTTPS с использованиСм TLS ΡˆΠΈΡ„Ρ€ΠΎΠ²Π°Π½ΠΈΡ.
    ΠŸΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ подписанныС URL ΠΏΠΎΠ·Π²ΠΎΠ»ΡΡŽΡ‚ ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡ‚ΡŒ Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΉ доступ ΠΊ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ для ΠΎΠ±ΠΌΠ΅Π½Π° Ρ„Π°ΠΉΠ»Π°ΠΌΠΈ с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½Π΅ΠΌ доступа.

  3. Π˜Π½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡ с внСшними систСмами Π°ΡƒΡ‚Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ
    РСшСния On-prem S3 ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΡƒΡŽΡ‚ΡΡ с ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ‚ΠΈΠ²Π½Ρ‹ΠΌΠΈ систСмами Π°ΡƒΡ‚Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΈ, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ Active Directory ΠΈ OAuth для Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ управлСния ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌΠΈ.

  4. Аудит ΠΈ Π»ΠΎΠ³ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅
    MinIO прСдоставляСт ΠΆΡƒΡ€Π½Π°Π»Ρ‹ Π°ΡƒΠ΄ΠΈΡ‚Π° для отслСТивания событий доступа, Ρ‡Ρ‚ΠΎ обСспСчиваСт соотвСтствиС трСбованиям ΠΈ ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ бСзопасности.

  5. ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ с ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ доступом Π² On-Prem S3

  • ΠšΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΡ бСзопасности: ΠŸΡ€Π°Π²ΠΈΠ»ΡŒΠ½Π°Ρ настройка ΡˆΠΈΡ„Ρ€ΠΎΠ²Π°Π½ΠΈΡ, IAM Ρ€ΠΎΠ»Π΅ΠΉ ΠΈ ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊ доступа ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ экспСртизы.
  • ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ: По ΠΌΠ΅Ρ€Π΅ роста систСмы ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠ°Π½ΠΈΠ΅ постоянного управлСния доступом для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π½Π°Π±ΠΎΡ€ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΎΠΉ.

3. ΠšΠ»ΡŽΡ‡Π΅Π²Ρ‹Π΅ различия: HDFS ΠΏΡ€ΠΎΡ‚ΠΈΠ² On-Prem S3

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΡŒHDFSOn-Prem S3 (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, MinIO)
Π’ΠΈΠΏ хранСнияБлочноС Ρ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ Ρ„Π°ΠΉΠ»ΠΎΠ²ΠžΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎΠ΅ Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰Π΅
ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ Π΄ΠΎΡΡ‚ΡƒΠΏΠ°Π Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ POSIX, Kerberos, ACLsIAM Ρ€ΠΎΠ»ΠΈ, ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ для Π±Π°ΠΊΠ΅Ρ‚Π°
Π“Ρ€Π°Π½ΡƒΠ»ΡΡ€Π½ΠΎΡΡ‚ΡŒ управлСния Π΄ΠΎΡΡ‚ΡƒΠΏΠΎΠΌΠ Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ Ρ„Π°ΠΉΠ»ΠΎΠ² ΠΈ ΠΊΠ°Ρ‚Π°Π»ΠΎΠ³ΠΎΠ²; ACLsВолько Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ Π±Π°ΠΊΠ΅Ρ‚Π°
АутСнтификацияKerberosΠ˜Π½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡ Active Directory, OAuth
Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΠ’Ρ€Π΅Π±ΡƒΠ΅Ρ‚ слоТного управлСния ΠΎΠ±ΠΎΡ€ΡƒΠ΄ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ ΠΈ кластСромУпрощСнноС ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅
ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒΠ“ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ с Ρ€ΡƒΡ‡Π½Ρ‹ΠΌ Π²ΠΌΠ΅ΡˆΠ°Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΠΎΠΌΠ‘Π΅ΡΡˆΠΎΠ²Π½ΠΎΠ΅ Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅
ΠžΡ‚ΠΊΠ°Π·ΠΎΡƒΡΡ‚ΠΎΠΉΡ‡ΠΈΠ²ΠΎΡΡ‚ΡŒΠ Π΅ΠΏΠ»ΠΈΠΊΠ°Ρ†ΠΈΡ данныхРСпликация Π΄Π°Π½Π½Ρ‹Ρ…
ΠŸΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΎ для Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ‡Ρ‚Π΅Π½ΠΈΠΉ ΠΈ Π·Π°ΠΏΠΈΡΠ΅ΠΉΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΎ для случайного доступа ΠΊ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°ΠΌ
Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ управлСнияВрСбуСт слоТной настройки бСзопасности (Kerberos, ACLs)Π£ΠΏΡ€ΠΎΡ‰Π΅Π½Π½ΠΎΠ΅ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ доступом Ρ‡Π΅Ρ€Π΅Π· ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠΈ
ΠŸΠ°Ρ‚Ρ‚Π΅Ρ€Π½Ρ‹ доступа ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌΠ›ΡƒΡ‡ΡˆΠ΅ для большой ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…Π›ΡƒΡ‡ΡˆΠ΅ для ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎΠ³ΠΎ хранСния ΠΈ случайного доступа
Π˜Π½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡ с Big DataНативная интСграция с экосистСмой HadoopΠ‘ΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚ΡŒ с инструмСнтами Big Data, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ Spark
ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ бСзопасностиKerberos, Ranger для управлСния ΠΏΠΎΠ»ΠΈΡ‚ΠΈΠΊΠ°ΠΌΠΈTLS, ΡˆΠΈΡ„Ρ€ΠΎΠ²Π°Π½ΠΈΠ΅, OAuth, ΠΏΡ€Π΅Π΄Π²Π°Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ подписанныС URL

4. Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅: Π‘Ρ‚ΠΎΠΈΡ‚ Π»ΠΈ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ с HDFS Π½Π° On-Prem S3?

ΠŸΡ€Π΅ΠΈΠΌΡƒΡ‰Π΅ΡΡ‚Π²Π° On-Prem S3 (MinIO):

  • ΠœΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ: РСшСния On-prem S3 ΠΏΡ€Π΅Π΄ΠΎΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Π±ΠΎΠ»Π΅Π΅ Π³ΠΈΠ±ΠΊΠΎΠ΅ ΠΈ простоС Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ΅ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ с HDFS.
  • Π£ΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅: MinIO ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡΠΌΠΈ On-prem S3 Π»Π΅Π³Ρ‡Π΅ ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ.
  • ΠšΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒ доступа: Π˜Π½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡ MinIO с IAM, LDAP ΠΈ OAuth ΡƒΠΏΡ€ΠΎΡ‰Π°Π΅Ρ‚ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ доступом для мноТСства ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ
  • Π‘ΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚ΡŒ с ΠΎΠ±Π»Π°ΠΊΠΎΠΌ: MinIO прСдоставляСт ΡΠΎΠ²ΠΌΠ΅ΡΡ‚ΠΈΠΌΠΎΡΡ‚ΡŒ с API S3, Ρ‡Ρ‚ΠΎ позволяСт ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ с инструмСнтами ΠΈ сСрвисами, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ‚Ρ€Π΅Π±ΡƒΡŽΡ‚ S3, Π΄Π°ΠΆΠ΅ Ссли Π΄Π°Π½Π½Ρ‹Π΅ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π΅Π½Ρ‹ Π½Π° локальной инфраструктурС.

ΠŸΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄Π° Π½Π° On-Prem S3:

  • Π—Π°Ρ‚Ρ€Π°Ρ‚Ρ‹ Π½Π° ΠΌΠΈΠ³Ρ€Π°Ρ†ΠΈΡŽ: ΠŸΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ с HDFS Π½Π° модСль ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎΠ³ΠΎ хранСния Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π·Π½Π°Ρ‡ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ Π² Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ€Π°Π±ΠΎΡ‡ΠΈΡ… процСссах.
  • ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° Π΄Π°Π½Π½Ρ‹Ρ…: HDFS ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½ для высокоскоростной ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Ρ„Π°ΠΉΠ»ΠΎΠ², ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ эффСктивным для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² Π΄Π°Π½Π½Ρ‹Ρ…. Если Ρ€Π°Π±ΠΎΡ‡ΠΈΠ΅ процСссы сильно зависят ΠΎΡ‚ инструмСнтов Π½Π° Π±Π°Π·Π΅ Hadoop,, ΠΏΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ Π½Π° On-prem S3 ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΡΠ»ΠΎΠΆΠ½ΠΈΡ‚ΡŒ процСсс.
  • ΠšΡ€ΠΈΠ²Π°Ρ обучСния: ΠŸΠ΅Ρ€Π΅Ρ…ΠΎΠ΄ ΠΎΡ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π»ΠΎΡ‡Π½ΠΎΠ³ΠΎ хранСния (HDFS) ΠΊ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎΠΌΡƒ Ρ…Ρ€Π°Π½Π΅Π½ΠΈΡŽ (S3) ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΡ‚ вашСй ΠΊΠΎΠΌΠ°Π½Π΄Ρ‹ Π°Π΄Π°ΠΏΡ‚Π°Ρ†ΠΈΠΈ ΠΊ Π½ΠΎΠ²Ρ‹ΠΌ ΠΏΠ°Ρ€Π°Π΄ΠΈΠ³ΠΌΠ°ΠΌ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ….

Когда Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ On-Prem S3:

  • Если Π½ΡƒΠΆΠ½ΠΎ Π³ΠΈΠ±ΠΊΠΎΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎΠ΅ Ρ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ с Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡ с ΠΌΠΈΠ½ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ΠΌ физичСской инфраструктурой.
  • Если Ρ€Π°Π±ΠΎΡ‡ΠΈΠ΅ процСссы большС ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π½Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π½ΠΎΠ΅ Ρ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ€Π°Π±ΠΎΡ‚Π° с малСнькими Ρ„Π°ΠΉΠ»Π°ΠΌΠΈ, ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ ΠΌΠ΅Π΄ΠΈΠ°-Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, Π»ΠΎΠ³Π°ΠΌΠΈ ΠΈ Ρ‚. Π΄.).
  • Если трСбуСтся ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ΡŒ ΠΈΠ½Ρ‚Π΅Π³Ρ€Π°Ρ†ΠΈΡŽ с ΠΎΠ±Π»Π°Ρ‡Π½Ρ‹ΠΌΠΈ инструмСнтами ΠΈΠ»ΠΈ рассматриваСтся гибридная облачная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π°.

Когда ΠΎΡΡ‚Π°Π²Π°Ρ‚ΡŒΡΡ с HDFS:

  • Если Ρ€Π°Π±ΠΎΡ‡ΠΈΠ΅ процСссы Π²ΠΊΠ»ΡŽΡ‡Π°ΡŽΡ‚ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… с ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ доступом (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΠ°ΠΊΠ΅Ρ‚Π½Ρ‹Π΅ задания), Π³Π΄Π΅ HDFS ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ справляСтся.
  • Если Π²Ρ‹ ΡƒΠΆΠ΅ Π³Π»ΡƒΠ±ΠΎΠΊΠΎ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ Π² экосистСму Hadoop ΠΈ Π²Π°ΠΌ Π½ΡƒΠΆΠ½Π° тСсная интСграция с Ρ‚Π°ΠΊΠΈΠΌΠΈ инструмСнтами, ΠΊΠ°ΠΊ Hive ΠΈ HBase.
  • Если Π½ΡƒΠΆΠ½Π° сильная интСграция с Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ°ΠΌΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ ΠΏΠΎΠ΄ HDFS.