Migration

Nach Neosync: Synthetische Daten und Anonymisierung an einem Ort ersetzen

Neosync hat zwei Jobs gemacht, und als das Repo im August 2025 read-only wurde, hast du beide auf einen Schlag verloren. Hier ist, was jeder davon war, und wie du sie wieder abdeckst, ohne zwei neue Tools zusammenzuschrauben.

SeedBase · ~7 Min. Lesezeit

Das ist eine praktische Migrations-Notiz, keine Feature-Tour. Wenn du Neosync in CI oder in einem Staging-Refresh-Job laufen hattest, ist die nützliche Frage, auf welchen der beiden Jobs du dich wirklich verlassen hast, denn die Antwort entscheidet, womit du ersetzt.

Was mit Neosync passiert ist

Neosync wurde im September 2025 von Grow Therapy übernommen. Das Open-Source-Repository nucleuscloud/neosync wurde am 30. August 2025 archiviert, und der gehostete Cloud-Dienst ist offline. Archiviert ist endgültiger als ungepflegt: Das Repo ist read-only, es gibt keine weiteren Releases, und es gibt keinen Maintainer, an den du ein kaputtes Upgrade eskalieren kannst. Wenn es heute noch in deiner Pipeline läuft, läuft es auf Pump.

Neosync hatte zwei Jobs, und das ist der Knackpunkt

Die meiste Verwirrung beim Ersetzen von Neosync kommt daher, es als eine Sache zu behandeln. Es waren zwei:

Viele der kursierenden Migrations-Ratschläge geben dir für jeden Job ein eigenes Tool, du ersetzt also eine Dependency durch zwei. Gut zu wissen, bevor du anfängst, denn du kannst beides auch aus einem einzigen Schema abdecken.

Job 1, synthetische Datengenerierung

Wenn du Neosync genutzt hast, um eine leere Datenbank mit realistischen, beziehungs-korrekten Zeilen zu füllen, ist der Ersatz schema-getriebene Generierung. Richte einen Generator auf dein Schema (SQL, Django-Modelle oder ein Prisma-Schema), und er läuft den Foreign-Key-Graphen ab, erzeugt Eltern vor Kindern, sodass jede Referenz aufgeht. Kein Prod-Zugriff nötig, nichts Sensibles im Datensatz, deterministisch pro Seed, sodass ein CI-Lauf reproduzierbar ist.

Das ist derselbe Job, den Snaplet Seed gemacht hat, falls du die beiden vergleichst. Wenn du auch Snaplet genutzt hast, deckt die Snaplet-Seed-Migrations-Notiz die Generierungs-Seite ausführlicher ab.

Job 2, eine echte Produktionsdatenbank anonymisieren

Die andere Hälfte wird gern unterschätzt. Wenn du echt-geformte Daten brauchst, kopierst du Produktion und entfernst die PII. Der Ersatz muss zwei Dinge gleichzeitig schaffen: personenbezogene Felder maskieren und die Datenbank ladbar halten, das heißt, Foreign Keys und Beziehungen müssen das Maskieren überleben.

SeedBase macht das direkt. Es kann PII in-place maskieren und ein referenziell konsistentes Subset einer echten Datenbank ziehen, geschnitten entlang des Foreign-Key-Graphen, sodass die anonymisierte oder kleinere Kopie immer noch lädt und sich verhält wie das Original. Das ist die Anonymisierungs-Hälfte dessen, was Neosync gemacht hat. Eine ausführlichere Anleitung gibt es in Produktionsdaten für Staging maskieren und auf der DSGVO-Anonymisierungsseite.

Ein Tool statt zwei

Der ehrliche Grund, beide Jobs zu erwähnen, ist, dass die Seeding-Tool-Kategorie 2025 zerfasert ist: Snaplet wurde eingestellt, Neosync übernommen und archiviert, und der gängige Rat wurde "nimm ein Tool zum Generieren und ein anderes zum Anonymisieren". SeedBase deckt beide Seiten aus demselben Schema ab, eine Neosync-Migration muss also nicht heißen, zwei Ersatz-Tools einzuführen und zu verdrahten.

Kein Eins-zu-eins-Port, eine Konsolidierung. Neosync war Postgres und MySQL first und hat Generierung und Anonymisierung über sein Produkt verteilt. SeedBase macht beides aus einem Schema und nimmt Django und rohes SQL als Eingaben dazu. Getestet gegen ein echtes 20-Apps-Django-Projekt mit 226 Tabellen, daher kommen die Foreign-Key-Reihenfolge, das Subsetting und die Verteilungs-Behandlung. EU-gehostet, keine Third-Party-Tracker, alles exportierbar.

FAQ

Wird Neosync noch gepflegt?

Nein. Neosync wurde im September 2025 von Grow Therapy übernommen, das Open-Source-Repo nucleuscloud/neosync wurde am 30. August 2025 archiviert, und die gehostete Cloud ist offline. Ein archiviertes Repo heißt: keine Fixes, keine Releases und kein Maintainer, an den du eskalieren kannst.

Brauche ich zwei Tools, um Neosync zu ersetzen?

Nein. Neosync hat zwei Jobs gemacht, synthetische Datengenerierung und Produktionsdaten-Anonymisierung, und viele Migrations-Ratschläge schicken dich jetzt für jeden zu einem eigenen Tool. SeedBase deckt beides aus demselben Schema ab: Foreign-Key-konsistente Daten von Grund auf generieren, oder eine bestehende Datenbank maskieren und subsetten.

Kann ich eine echte Produktionsdatenbank anonymisieren, nicht nur neue Daten generieren?

Ja. SeedBase kann personenbezogene Daten in-place maskieren und ein referenziell konsistentes Subset einer echten Datenbank ziehen, also die Anonymisierungs-Hälfte dessen, was Neosync gemacht hat, mit gültig bleibenden Foreign Keys.

Bleiben Foreign Keys nach dem Maskieren oder Subsetten gültig?

Ja. Subsets werden entlang des Foreign-Key-Graphen geschnitten, sodass jede Referenz weiter aufgeht, und das Maskieren erhält die Beziehungen zwischen den Zeilen. Du bekommst eine kleinere oder anonymisierte Datenbank, die immer noch lädt und sich verhält wie das Original.

Beide Neosync-Jobs ersetzen, kostenlos

Generiere Foreign-Key-konsistente Daten aus deinem Schema, oder maskiere und subsette eine echte Datenbank. Ein Tool, EU-gehostet, keine Kreditkarte.

  • Generieren oder anonymisieren
  • Jeder FK geht auf
  • SQL / CSV / JSON
  • EU-gehostet
Kostenlos starten, ohne Karte

Mehr: SeedBase vs Neosync · Produktionsdaten maskieren · Snaplet Seed verlassen