[Apache Impala]임팔라에 Hive UDF를 (User Defined Function) 등록하기

2020. 2. 6. 18:30·Bigdata Engineering

impala 에 hive udf를 등록하기 위한 가이드 포스트.

임팔라에 하이브-HIVE UDF 등록

 

1. java로 쓰여진 Hive UDF 파일을 준비.

  • Location : hdfs://my.namenode.com:8020/user/username/lib/my-udf.jar

 

2. impala-shell 실행

impala-shell

 

3. impala-shell에서 함수 등록

  • hive와 다르게 function parameter와 return 타입을 명시해줘야 합니다.
  • location 경로는 local 경로가 아닌 hdfs 경로로 지정해주셔야 합니다.

     

    create function my_urldecode(string, string) returns string location 'hdfs://my.namenode.com:8020/user/username/lib/my-udf.jar' symbol='com.my.udf.MyURLDecode'

     

impala shell 기타 명령어

  • drop function

    DROP FUNCTION my_urldecode(STRING, STRING);
  • show function

    show functions;

 

UDF 등록후 impala에서 데이터 조회시 정상적이지 않은 값 return 시

  • impala는 유니코드 기반의 python이고, hive udf는 java기반이기 때문에 한글에 있어서 인코딩 문제가 발생함.
  • 이 내용은 다음 포스트에서 다루도록 하겠습니다
저작자표시 (새창열림)

'Bigdata Engineering' 카테고리의 다른 글

[CDH] 클라우데라 Hadoop - Open JDK 교체(oracle jdk -> open jdk)  (0) 2020.02.14
[CDH] Cloudera Manager 클라우데라 매니저 버전 업그레이드  (0) 2020.02.10
[Apache Impala] c++ 을 이용하여 urldecoder UDF 작성 하기  (0) 2020.02.07
[CDH] 클라우데라 로그 확인 - cloudera log check  (0) 2020.02.04
[Apache Impala]impala-shell 임팔라 쉘 구동 소스 코드 분석/수정 on Cloudera  (0) 2020.02.04
'Bigdata Engineering' 카테고리의 다른 글
  • [CDH] Cloudera Manager 클라우데라 매니저 버전 업그레이드
  • [Apache Impala] c++ 을 이용하여 urldecoder UDF 작성 하기
  • [CDH] 클라우데라 로그 확인 - cloudera log check
  • [Apache Impala]impala-shell 임팔라 쉘 구동 소스 코드 분석/수정 on Cloudera
DAMAT
DAMAT
Computer Science Engineer를 위한 tiStory
  • DAMAT
    Damat - Idea Factory
    DAMAT
  • 전체
    오늘
    어제
    • 분류 전체보기 (26)
      • Bigdata Engineering (14)
        • 빅데이터 플랫폼 R&D (1)
      • System Engineering (3)
      • Linux Server (3)
      • 프로그래밍 (1)
      • 교육 (1)
        • 문제 (1)
      • 코딩테스트 기록지 (2)
        • Python (1)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    presto 메모리 설정
    mysql 보관기관 설정
    파이썬 소켓통신
    gitlab 패치
    주키퍼 cli
    빅데이터 모니터링
    kafka 명령어
    db binlog
    python 소켓통신
    python데몬
    zookeeper cli
    gitlab 버전
    주키퍼 명령어
    kafka cli
    activemq 모니터링
    hadoop이란
    리소스매니저
    zookeeper 명령어
    파이썬 소켓
    python 소켓 프로그래밍
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.4
DAMAT
[Apache Impala]임팔라에 Hive UDF를 (User Defined Function) 등록하기
상단으로

티스토리툴바