Data Scientist/Engineer

운영중인 서비스에서 산출되는 대량의 원천 데이터를 실시간으로 처리/가공할 수 있는 배치 및 스트리밍 데이터 파이프라인을 설계하고 확장할 경험 있는 엔지니어를 찾고 있습니다. 자사의 엔지니어, 서비스 매니저, 비즈니스 매니저 및 분석가들이 데이터를 통해 더 나은 의사결정을 하기 위해 이 시스템을 통해 구조적으로 데이터를 분석할 수 있는 기능을 제공해야 합니다. 현재는 Kafka, Flink, VertX, ElasticSearch, LogStash, CouchBase, Druid, MySQL 과 같은 제품/프레임워크들을 사용하고 있습니다. 데이터 처리 기법은 지금도 활발히 연구되고 발전하고 있으므로 특정한 기술과 기법들에 대해 해박한 것 보다는 단순성과 신뢰성은 고정할 수 있는 것이 아니라 매 의사결정이 이루어 질 때 마다 조심스럽게 계산되어야 한다는 것을 이해하고 있는 엔지니어를 찾고 있습니다. 또한 저희는 함께 일하면서 서로 배우고 발전하는 것을 즐기는 사람들입니다.

 

 

 

 

게임 서버 엔지니어들과 협업하여 하루 수백만 건의 이벤트를 신뢰성 있게 전송하고 처리하는 체계를 만들어야 합니다. 또한, 필요한 정보의 형태는 계속 변경될 수 밖에 없으므로, 원천데이터를 필요시 재처리 가능한 형태로 영속적으로 저장해야 합니다. 사내 구성원이 현재 상황을 분석하기 위해 처리된 데이터를 이용해 의미 있는 정보를 구성하고 최적화 할 수 있는 체계를 만들어 사내에 서비스해야 합니다. 그리고 정형화된 패턴을 분석하여 비정상 사용자나 시스템 이상을 탐지하여 통지하는 체계도 구축해야 합니다. 또한 현재의 구성이 목적을 위해 맞지 않거나 불충분한 상태라면 최적의 체계를 갖추기 위해 계속 개선해야 합니다.

 

  ·  새로운 기술에 대한 호기심과 빨리 배우고 이해하는 능력

  ·  상용화 이력이 있는 대규모 데이터 파이프라인 구축 경험

  ·  깔끔한 Java, Scala, SQL 코드 작성 능력

  ·  Lambda 혹은 Kappa architecture에 대한 깊이 있는 소견

  ·  NoSQL 데이터 모델링 경험과 RDB와 대비되는 강점과 약점에 대한 이해

  ·  최소한의 가이드와 지시 내에서 스스로 더 나은 것을 만들어 낼 수 있는 태도와 능력

  ·  충실한 컴퓨터 과학 기반 지식: 자료구조, 알고리즘, 프로그래밍 언어, 분산 시스템, 정보검색(information retrieval) 등

  ·  복잡한 기술 개념과 추상화된 데이터의 의미를 다른 팀원에게 설명할 수 있을 정도의 커뮤니케이션 능력

  ·  뛰어난 문제 해결 능력

 

 

 

 

 

 

 

  ·  3년 이상의 internet-facing 온라인 서비스의 개발 또는 운영 경험

  ·  Java 기반의 프로젝트 완수 경험

  ·  Unix-like 환경의 이해와 bash shell 활용 능력

  ·  SQL script (DQL/DML) 사용 경험 뛰어난 문제 해결 능력

 

 

 

 

 

 

  ·  컴퓨터 공학/과학 및 수학 등 관력 학과 학위 또는 이와 동등한 수준의 다른 학습 이력

  ·  Kafka 기반 스트리밍 파이프라인의 운영/업그레이드/디버깅 경험

  ·  AWS와 같은 가상화 기반 software-defined provisioning에 대한 지식 또는 경험

  ·  Unix-like 환경의 능숙한 활용

  ·  회귀분석, 가설검정 등의 통계학 관련 지식

 

 

 

Please reload

Please reload

Career

Copyright 2014 NSUSLAB. ALL RIGHTS RESERVED.