Data Scientist – zastępstwo na ok. 12 miesięcy

Nowa

BI & Data

Data Scientist – zastępstwo na ok. 12 miesięcy

Transition Technologies-Science

Rodzaj pracy

Pełny etat

Doświadczenie

Specjalista / Mid

Forma zatrudnienia

UoP, B2B

Tryb pracy

Praca w pełni zdalna

Wymagane umiejętności

polski B2

angielski B2

Python

R programming language

Pandas/Tidyverse

tidymodels/Scikit-learn/PyTorch

Docker

GIT

Mile widziane

narzędzia do generowania danych syntetycznych

Kubernates

cloud

MLOps

LLM

Opis stanowiska

Rekrutacja zdalna

Jesteśmy Transition Technologies-Science. Opiekujemy się danymi medycznymi i naszymi partnerami z sektora ochrony zdrowia.

Zespół deweloperski tworzy specjalistyczne oprogramowanie dla ośrodków badań klinicznych, szpitali, badaczy i lekarzy. Wykorzystując najnowocześniejsze technologie IT, staramy się wspierać i ulepszać procesy badawcze, diagnostyczno-terapeutyczne oraz odkrywać wiedzę zgromadzoną w licznych bazach medycznych.

Zespół specjalistów ds. danych i statystyków świadczy usługi Data Science, oferując wsparcie analityczne w badaniach klinicznych. Nasi eksperci przeprowadzają zaawansowane analizy z obszaru statystyki klinicznej i machine learning służące wspomaganiu procesów diagnostycznych, terapeutycznych oraz monitorowaniu jakości leczenia.

Poznaj wszystkie nasze produkty i usługi: https://ttsi.com.pl/; https://ecrf.com/

Poza tym, że dokładamy swoje cegiełki do ważnych spraw:

jesteśmy drużyną sympatycznych i jednocześnie bardzo różnych osób,
stawiamy na koleżeńską atmosferę, współpracę opartą na zaufaniu i dialogu,
wspólnie kreujemy miejsce, w którym doświadczeni specjaliści mogą wykorzystywać wszystkie swoje umiejętności i stale poszerzać kompetencje, a juniorzy otrzymują wsparcie w budowaniu wiedzy.

Ponadto oferujemy:

ciekawą pracę przy różnorodnych projektach z obszaru niekomercyjnych badań klinicznych,
udział w projektach, nastawionych na przejrzystość, solidną walidację i pragmatyczne wykorzystanie AI – ponieważ nasze rozwiązania trafiają bezpośrednio do lekarzy i badaczy,
przestrzeń do inicjatywy, dużą samodzielność w realizacji powierzonych zadań,
współdziałanie z zespołem pasjonatów dbających o jakość i stałe ulepszanie swojej pracy,
współpracę w oparciu o umowę o pracę lub B2B na czas nieobecności jednej z naszych koleżanek (ok. 12 miesięcy) – z możliwością przedłużenia,
elastyczne godziny pracy – pracujemy full time, core hours (czas wspólnej pracy zespołowej) przypada na godz. 10:00-15:30, jednak możesz dopasować godziny rozpoczęcia i zakończenia pracy do swoich preferencji,
benefity takie jak: opieka medyczna, karta sportowa, kurs języka angielskiego,
możliwość pracy 🚩 w jednym z naszych biur: w Warszawie lub Ostrowie Wielkopolskim 🚩 hybrydowo lub 🚩 w 100% w trybie home office.

Jako Data Scientist będziesz:

współpracował w małym interdyscyplinarnym zespole obejmującym specjalistów z zakresu data science, deweloperów, klinicystów,
dokumentował i dzielił się wiedzą (raporty markdown, Shiny, Jupyter),
miał okazję włączyć się w prace nad jednym z projektów dla Regionalnych Centrów Medycyny Cyfrowej:

1. Budowy generatora danych syntetycznych umożliwiającego szpitalom bezpieczne testowanie algorytmów bez udostępniania danych wrażliwych. W ramach tego projektu będziesz:

projektował i implementował algorytmy generowania danych syntetycznych (CTGAN, Python/R, SDV/Synthpop) - by precyzyjnie odwzorować statystyki i strukturę prawdziwych danych medycznych, zapewniając jednocześnie prywatność generowanych informacji,
zapewniał integrację kodu z Dockerem, rozwijał i utrzymywał testy automatyczne oraz wdrażał procesy CI/CD;

2. Budowy środowiska do rozproszonej analizy danych - bezpiecznej i skalowalnej platformy, która umożliwi badaczom przeprowadzanie złożonych analiz danych on-premise lub w chmurze. W ramach tego projektu będziesz:

projektować i konfigurować architekturę ww. platformy, w tym klastry Kubernetes,
odpowiadać za orkiestrację i skalowanie zadań analitycznych,
zarządzać bezpieczeństwem platformy, wdrażając systemy autoryzacji i mechanizmy bezpiecznego uruchamiania kodu;

3. Rozwoju pipelinu ekstrakcji kluczowych informacji z nieustrukturyzowanej dokumentacji medycznej, wykorzystującego potencjał Dużych Modeli Językowych (LLM). W ramach tego projektu będziesz:

wybierać, dostosowywać i wdrażać modele LLM, zarządzając całym ich cyklem życia (MLOps),
zapewniać zgodność i jakość danych poprzez rygorystyczną walidację anonimizacji i precyzji ekstrakcji, z dbałością o zgodność z RODO.

Stanowisko będzie dla Ciebie idealne, jeżeli:

posiadasz min. 3 lata produkcyjnego doświadczenia w kodowaniu w R lub Pythonie, w tym z bibliotekami takimi jak Pandas/Tidyverse oraz np. tidymodels/Scikit-learn/PyTorch,
znasz się na konteneryzacji, potrafisz budować obrazy Dockerowe, korzystać z Docker Compose i masz podstawową wiedzę o sieciach w Dockerze,
na co dzień pracujesz z systemem Git, aktywnie uczestnicząc w procesach pull request i code review,
swobodnie komunikujesz się w języku angielskim (min. B2+),
potrafisz efektywnie i lubisz pracować w zespole,
aktywnie pogłębiasz swoją wiedzę i chętnie dzielisz się nią z innymi.

Mile nas zaskoczysz, jeśli dodatkowo możesz pochwalić się:

doświadczeniem w pracy z narzędziami do generowania danych syntetycznych (np. Synthpop, SDV, CTGAN) lub jesteś gotów szybko się ich nauczyć,
znajomością Kubernetes, Helm oraz doświadczeniem w pracy z chmurą (AWS/Azure/GCP),
znajomością narzędzi AI-assisted coding (np. Cursor, GitHub Copilot),
udziałem w hackathonach lub projektach open-source,
podstawami MLOps (MLflow, DVC, testy danych).

Proces rekrutacyjny w TT-SI prowadzony jest w całości zdalnie via Teams.

Zakłada 3 etapy: 1️⃣ Rozmowę wstępną ze Specjalistą ds. HR. 2️⃣ Rozmowę techniczną (Python/R, Docker, case study). 3️⃣ Rozmowę z liderem projektu.

Uprzedzamy, że skontaktujemy się z wybranymi kandydatami.

Rekomendowane oferty

Data Scientist – zastępstwo na ok. 12 miesięcy

Transition Technologies-Science

Wymagane umiejętności

polski B2

angielski B2

Python

R programming language

Pandas/Tidyverse

tidymodels/Scikit-learn/PyTorch

Docker

GIT

Mile widziane

narzędzia do generowania danych syntetycznych

Kubernates

cloud

MLOps

LLM

Opis stanowiska

Managed Services Scrum Lead (Procurement BI)

No-Code / Low-Code Developer

Mid Data Engineer | US robotics start-up

RPA Developer

Project Manager