Data Engineer - databricks (k/m/x)

100 - 140 PLN/ godz.B2B (netto)
SeniorFull-time·B2B
#322874·Dodano 26 dni temu·26
Źródło: nofluffjobs.com
Aplikuj teraz

Tech Stack / Keywords

PythonSQLApache SparkPySparkDatabricksETLdata-miningMachine learning

Firma i stanowisko

Poszukujemy Data Engineer do pracy przy projekcie związanym z rozwojem pojazdów autonomicznych (Autonomous Vehicles – AV). Osoba na tym stanowisku będzie analizować duże wolumeny danych sensorowych pochodzących z floty pojazdów testowych (kamery, LiDAR, radar), identyfikować rzadkie i krytyczne scenariusze drogowe (edge cases) oraz przygotowywać dane do symulacji i trenowania modeli ML.


Wymagania

  • Silne podstawy w inżynierii oprogramowania
  • Zaawansowana znajomość SQL i umiejętność pisania złożonych zapytań
  • Zaawansowana znajomość Python
  • Bardzo dobra znajomość Spark / PySpark
  • Praktyczne doświadczenie z Databricks
  • Doświadczenie w zaawansowanej analizie danych
  • Doświadczenie w analizie szeregów czasowych (time-series)
  • Zrozumienie workflowów Machine Learning (przygotowanie danych do trenowania modeli)
  • Umiejętność pracy z dużymi wolumenami danych

Nice to have:

  • Doświadczenie z danymi sensorowymi (np. kamery, LiDAR, radar)
  • Znajomość domeny autonomous driving / AV
  • Doświadczenie z danymi półstrukturalnymi (np. tablice struktur z modeli detekcji obiektów)

Obowiązki

  • Analiza dużych wolumenów danych z sensorów w celu identyfikacji edge cases (np. nagłe hamowanie, bliskie pojazdy)
  • Pisanie złożonych zapytań w SQL / Python / Spark (PySpark) do filtrowania, agregowania i transformowania danych
  • Analiza i przetwarzanie danych szeregów czasowych
  • Praca z wewnętrznymi narzędziami do wyszukiwania danych oraz workflowów auto-labeling
  • Przetwarzanie danych strukturalnych i półstrukturalnych generowanych przez modele detekcji obiektów
  • Identyfikowanie danych odpowiednich do symulacji pojazdów autonomicznych oraz pipeline’ów treningowych ML
  • Projektowanie i rozwój skryptów do zaawansowanego data mining
  • Budowa i utrzymanie procesów ETL dla dużych zbiorów danych
  • Rozwój i usprawnianie wewnętrznych narzędzi analitycznych wspierających eksplorację danych
  • Proponowanie i walidacja nowych podejść analitycznych usprawniających odkrywanie danych
SQUARE ONE RESOURCES sp. z o.o.

SQUARE ONE RESOURCES sp. z o.o.

124 aktywne oferty

Zobacz wszystkie oferty
Aplikuj teraz