Skąd wzięła się DataSynth PL
W 2024 roku rozmawialiśmy z dziesiątkami polskich firm, które chciały wdrożyć AI — rekomendacje produktów, chatboty obsługi klienta, modele scoringowe, systemy wykrywania fraudów. Każda z nich miała ten sam problem: brak danych do trenowania modeli.
Realne dane klientów? Zablokowane przez RODO i słuszną troskę o prywatność. Kupno danych za granicą? Albo niemożliwe prawnie, albo kosztuje fortunę w dolarach. Samodzielne generowanie? Wymaga specjalistów, których na rynku brakuje.
Postanowiliśmy to naprawić. DataSynth PL to odpowiedź na realną potrzebę rynku — polskie, RODO-compliant, wysokiej jakości dane syntetyczne w cenie dostępnej dla każdej firmy.
Pomysł i research
Wywiady z 40+ polskimi firmami. Potwierdzenie: problem z danymi do AI jest powszechny.
Pierwsze prototypy
Testy różnych metod generowania: GAN, VAE, LLM-based. Wybór podejścia opartego na modelach językowych jako najlepszego dla danych tabelarycznych.
Pierwsi klienci beta
5 firm testuje pierwsze zestawy danych. Feedback pozytywny — jakość statystyczna na poziomie danych realnych.
Publiczny launch
DataSynth PL dostępny dla wszystkich. Trzy plany cenowe, certyfikat RODO, wsparcie 6 branż.