Data Scientist – zastępstwo na ok. 12 miesięcy
Nowa
BI & Data

Data Scientist – zastępstwo na ok. 12 miesięcy

Rodzaj pracy
Pełny etat
Doświadczenie
Specjalista/Mid
Forma zatrudnienia
UoP, B2B
Tryb pracy
Praca w pełni zdalna

Wymagane umiejętności

polski B2

angielski B2

Python

R programming language

Pandas/Tidyverse

tidymodels/Scikit-learn/PyTorch

Docker

GIT

Mile widziane

narzędzia do generowania danych syntetycznych

Kubernates

cloud

MLOps

LLM

Opis stanowiska

Rekrutacja zdalna

Jesteśmy Transition Technologies-Science. Opiekujemy się danymi medycznymi i naszymi partnerami z sektora ochrony zdrowia.


Zespół deweloperski tworzy specjalistyczne oprogramowanie dla ośrodków badań klinicznych, szpitali, badaczy i lekarzy. Wykorzystując najnowocześniejsze technologie IT, staramy się wspierać i ulepszać procesy badawcze, diagnostyczno-terapeutyczne oraz odkrywać wiedzę zgromadzoną w licznych bazach medycznych.


Zespół specjalistów ds. danych i statystyków świadczy usługi Data Science, oferując wsparcie analityczne w badaniach klinicznych. Nasi eksperci przeprowadzają zaawansowane analizy z obszaru statystyki klinicznej i machine learning służące wspomaganiu procesów diagnostycznych, terapeutycznych oraz monitorowaniu jakości leczenia.


Poznaj wszystkie nasze produkty i usługi: https://ttsi.com.pl/; https://ecrf.com/

 

 

Poza tym, że dokładamy swoje cegiełki do ważnych spraw:

  • jesteśmy drużyną sympatycznych i jednocześnie bardzo różnych osób,

  • stawiamy na koleżeńską atmosferę, współpracę opartą na zaufaniu i dialogu,

  • wspólnie kreujemy miejsce, w którym doświadczeni specjaliści mogą wykorzystywać wszystkie swoje umiejętności i stale poszerzać kompetencje, a juniorzy otrzymują wsparcie w budowaniu wiedzy.

Ponadto oferujemy:

  • ciekawą pracę przy różnorodnych projektach z obszaru niekomercyjnych badań klinicznych,

  • udział w projektach, nastawionych na przejrzystość, solidną walidację i pragmatyczne wykorzystanie AI – ponieważ nasze rozwiązania trafiają bezpośrednio do lekarzy i badaczy,

  • przestrzeń do inicjatywy, dużą samodzielność w realizacji powierzonych zadań,

  • współdziałanie z zespołem pasjonatów dbających o jakość i stałe ulepszanie swojej pracy,

  • współpracę w oparciu o umowę o pracę lub B2B na czas nieobecności jednej z naszych koleżanek (ok. 12 miesięcy) – z możliwością przedłużenia,

  • elastyczne godziny pracy – pracujemy full time, core hours (czas wspólnej pracy zespołowej) przypada na godz. 10:00-15:30, jednak możesz dopasować godziny rozpoczęcia i zakończenia pracy do swoich preferencji,

  • benefity takie jak: opieka medyczna, karta sportowa, kurs języka angielskiego,

  • możliwość pracy 🚩 w jednym z naszych biur: w Warszawie lub Ostrowie Wielkopolskim 🚩 hybrydowo lub  🚩 w 100% w trybie home office.

 

Jako Data Scientist będziesz:

  • współpracował w małym interdyscyplinarnym zespole obejmującym specjalistów z zakresu data science, deweloperów, klinicystów,

  • dokumentował i dzielił się wiedzą (raporty markdown, Shiny, Jupyter),

  • miał okazję włączyć się w prace nad jednym z projektów dla Regionalnych Centrów Medycyny Cyfrowej:

1.       Budowy generatora danych syntetycznych umożliwiającego szpitalom bezpieczne testowanie algorytmów bez udostępniania danych wrażliwych. W ramach tego projektu będziesz:

  • projektował i implementował algorytmy generowania danych syntetycznych (CTGAN, Python/R, SDV/Synthpop) - by precyzyjnie odwzorować statystyki i strukturę prawdziwych danych medycznych, zapewniając jednocześnie prywatność generowanych informacji,

  • zapewniał integrację kodu z Dockerem, rozwijał i utrzymywał testy automatyczne oraz wdrażał procesy CI/CD;

2.       Budowy środowiska do rozproszonej analizy danych - bezpiecznej i skalowalnej platformy, która umożliwi badaczom przeprowadzanie złożonych analiz danych on-premise lub w chmurze. W ramach tego projektu będziesz:

  • projektować i konfigurować architekturę ww. platformy, w tym klastry Kubernetes,

  • odpowiadać za orkiestrację i skalowanie zadań analitycznych,

  • zarządzać bezpieczeństwem platformy, wdrażając systemy autoryzacji i mechanizmy bezpiecznego uruchamiania kodu;

3.       Rozwoju pipelinu ekstrakcji kluczowych informacji z nieustrukturyzowanej dokumentacji medycznej, wykorzystującego potencjał Dużych Modeli Językowych (LLM). W ramach tego projektu będziesz:

  • wybierać, dostosowywać i wdrażać modele LLM, zarządzając całym ich cyklem życia (MLOps),

  • zapewniać zgodność i jakość danych poprzez rygorystyczną walidację anonimizacji i precyzji ekstrakcji, z dbałością o zgodność z RODO.

 

Stanowisko będzie dla Ciebie idealne, jeżeli:

  • posiadasz min. 3 lata produkcyjnego doświadczenia w kodowaniu w R lub Pythonie, w tym z bibliotekami takimi jak Pandas/Tidyverse oraz np. tidymodels/Scikit-learn/PyTorch,

  • znasz się na konteneryzacji, potrafisz budować obrazy Dockerowe, korzystać z Docker Compose i masz podstawową wiedzę o sieciach w Dockerze,

  • na co dzień pracujesz z systemem Git, aktywnie uczestnicząc w procesach pull request i code review,

  • swobodnie komunikujesz się w języku angielskim (min. B2+),

  • potrafisz efektywnie i lubisz pracować w zespole,

  • aktywnie pogłębiasz swoją wiedzę i chętnie dzielisz się nią z innymi.

     

Mile nas zaskoczysz, jeśli dodatkowo możesz pochwalić się:

  • doświadczeniem w pracy z narzędziami do generowania danych syntetycznych (np. Synthpop, SDV, CTGAN) lub jesteś gotów szybko się ich nauczyć,

  • znajomością Kubernetes, Helm oraz doświadczeniem w pracy z chmurą (AWS/Azure/GCP),

  • znajomością narzędzi AI-assisted coding (np. Cursor, GitHub Copilot),

  • udziałem w hackathonach lub projektach open-source,

  • podstawami MLOps (MLflow, DVC, testy danych).

 

 

Proces rekrutacyjny w TT-SI prowadzony jest w całości zdalnie via Teams.

Zakłada 3 etapy: 1️⃣ Rozmowę wstępną ze Specjalistą ds. HR. 2️⃣ Rozmowę techniczną (Python/R, Docker, case study). 3️⃣ Rozmowę z liderem projektu.

 

Uprzedzamy, że skontaktujemy się z wybranymi kandydatami.