implementation("org.apache.hadoop:hadoop-common:3.1.2")
implementation("org.apache.hadoop:hadoop-mapreduce-client-core:3.1.2")
이는 Maven 서비스에 기본적으로 해당 오픈소스 라이브러리들이 게시되어 있는 것으로 이 코드를 작성하면 다운로드 받아 컴파일 및 런타임시 참조할 수 있도록 해준다.
hadoop jar <jar 파일 경로> <MAIN 클래스 위치> <전달 인자...>
여기서 jar 파일 경로는 현재 디렉터리 안에 있는 jar 파일 명을 입력해주고, MAIN 클래스 위치는 아까 Java 프로젝트를 생성할 때 기본 패키지 위치 및 Main 클래스 명칭을 입력해주면 된다. 마지막으로 이 프로그램에 넘겨질 인자, 아까 튜토리얼 기본 인자 2개는 대용량 파일 경로와 결과 출력 경로라고 했다. 이 정보를 입력해서 넘겨준다.
참고로 hadoop 명령어는 hadoop 이 설치된 배시 환경 (bashrc)에 등록되어 있기 때문에 하둡을 설치한 계정이 아닌 외부 계정의 경우 명령어가 없다고 뜰 수 있다.