skalujto.ai

Menu

  • GitHub
  • GitLab
  • privacy
  • AI
  • data governance

GitHub trenuje modele na repozytoriach bez wyraźnej zgody. Dlaczego przenieśliśmy się na GitLab

Artur Niklewicz
GitHub trenuje modele na repozytoriach bez wyraźnej zgody. Dlaczego przenieśliśmy się na GitLab

25 marca 2026 roku GitHub zaktualizował Politykę prywatności i Warunki korzystania z usługi. Główna zmiana: dane interakcji użytkowników Copilot Free, Pro i Pro+ — wejścia, wyjścia, fragmenty kodu i towarzyszący kontekst — będą używane do trenowania modeli AI GitHuba domyślnie, począwszy od 24 kwietnia 2026 roku. Jeśli nie podjąłeś działań przed tą datą, Twój kod jest już w pipeline. Ten artykuł wyjaśnia co dokładnie się zmieniło, jak sprawdzić swoje ustawienia i dlaczego przenieśliśmy projekty klientów na GitLab.

Co dokładnie GitHub zbiera — i do czego używa?

GitHub posługuje się precyzyjnym językiem. Polityka obejmuje dane interakcji: to co piszesz do Copilota, co Copilot zwraca i kontekst kodu użyty do wygenerowania odpowiedzi. GitHub oświadcza, że kod przechowywany w spoczynku w prywatnych repozytoriach nie jest używany do trenowania. HaČzyk: za każdym razem gdy Copilot jest aktywny, przetwarza Twój prywatny kod jako kontekst interakcji. Te dane sesji podlegają polityce interakcji, nie polityce przechowywania w spoczynku.

W zespół, w którym każdy developer ma otwarty Copilot podczas pracy nad kodem klienta, to rozróżnienie znika w praktyce.

Kogo dotyczy zmiana

  • Użytkownicy Copilot Free, Pro i Pro+ — objęci domyślnie od 24 kwietnia
  • Copilot Business i Copilot Enterprise — zwolnieni na mocy warunków umownych
  • Studenci i nauczyciele korzystający z GitHub Education — również zwolnieni

Większość indywidualnych developerów i małych zespół korzysta z Free, Pro lub Pro+. Zwolnienie dla enterprise jest handlowo sensowne — duży klienci negocjują warunki dotyczące danych. Oznacza to jednak, że zwolnienie jest niedostępne dla większości contributorów open-source, freelancerów i małych agencji.

Jak się wyrejestrować (jeśli jeszcze nie to zrobiłeś)

Przejdź do github.com/settings/copilot/features. W sekcji Prywatność znajdź opcję "Allow GitHub to use my data for AI model training" i wyłącz ją. Przełącznik domyślnie jest włączony — musisz go jawnie wyłączyć. Dotyczy to tylko Twojego osobistego konta; administratorzy organizacji kontrolują osobno ustawienie dla członków.

Dlaczego model opt-out to zły domyślny

Branże regulowane — finanse, ochrona zdrowia, obronność, sektor publiczny — działają według jasnej zasady: dane nie idą nigdzie bez wyraźnego zezwolenia. To samo dotyczy pracy na zlecenie objętej NDA. "Może być używane do trenowania, o ile się nie wyrejestrujesz" to framework niezgodny z tymi wymaganiami. Przenosi ciężar zgodności na dewelopera, a nie na platformę.

Sama analiza GitLaba określiła tę sytuację jako „boardźenie dla ładu informacyjnego” — i nie bez powodu. Opt-out technicznie istnieje. Ale poleganie na tym, że każdy developer w organizacji znajdzie właściwą stronę ustawień przed deadlinem, to nie jest mechanizm kontroli. To nadzieja, że nic się nie wydarzy.

Pozycja GitLaba: AI opt-in, zero trenowania domyślnie

GitLab nie trenuje modeli AI na kodzie klientów na żadnym poziomie. Funkcje AI są opt-in, nie opt-out. Co kluczowe, GitLab ma politykę zerowej retencji danych ze swoimi partnerami infrastruktury AI (Fireworks AI, AWS, Google): dane wejściowe i wyjściowe są usuwane natychmiast po dostarczeniu odpowiedzi. Brak przechowywania, brak logów monitoringu nadużyć, brak pipeline trenowania.

Dla instancji GitLab self-hosted sytuacja jest jeszcze prostsza: GitLab Inc. w ogóle nie ma dostępu do Twoich repozytoriów. To nie zobowiązanie polityczne — to fakt architektoniczny.

Jak wyglądała migracja

Przenieśliśmy wszystkie repozytoria projektów klientów na GitLab. Wewnętrzne narzędzia trafiły na instancję GitLab CE self-hosted na własnej infrastrukturze. Migracja zajęła około trzech dni roboczych, z czego większość na przepisanie plików pipelineów CI z składni GitHub Actions na YAML GitLab CI.

  • GitLab CI/CD zastępuje GitHub Actions — równoważny funkcjonalnie dla naszych workflow build, test i deploy
  • GitLab Container Registry zastępuje GitHub Container Registry
  • GitLab Issues i Milestones zastepują GitHub Issues i Projects
  • Integracja z Vercel działa bez zmian przez webhooks i Vercel CLI

Czy to przesadna reakcja?

Możliwe. GitHub nie opublikował danych o pochodzeniu zbiorów treningowych, więc niemożliwe jest stwierdzenie, czy konkretny kod został faktycznie wykorzystany. Ale "może być używany" w polityce prywatności oznacza brak gwarancji, że nie był. Dla projektów osobistych rachunek ryzyka jest Twoją decyzją. Dla kodu klienta objętego NDA — lub kodu należącego do infrastruktury klienta — nie pracujemy na gwarancjach. Pracujemy na kontrolach. GitLab daje nam kontrole, gdzie GitHub daje nam nadzieję.

Zobacz też