먼저 HDFS 싱크를 로거로 교체하여 입력이 올바르게 도착하는지 확인하십시오.
확인 된 후 싱크대에 대한 수세 설정을 조정하는 것이 좋습니다. HDFS 싱크 hdfs.batchSize
는 기본적으로를 통해 HDFS로 플러시하기 전에 이벤트를 일괄 처리합니다 100
. 출력이 처음으로 플러시되기 전에 100 개의 JSON 게시물을 보내야하기 때문에 이것은 아마도 문제 일 것입니다.
마지막으로 hdfs.writeFormat
기본적으로로 설정되어 Writable
있지 않은 조정을 시도 할 수도 있습니다 Text
.
텍스트 파일을 원하는 것 같으므로 다음과 같이 DataStream을 사용해야합니다.
a1.sinks.k1.hdfs.file.Type = DataStream
출처
https://stackoverflow.com/questions/22079801