[2023 01 27] 목소리 더빙, 보이스 도와주는 프로그램 개발 연습 일지 (2) - Whitmem
[2023 01 27] 목소리 더빙, 보이스 도와주는 프로그램 개발 연습 일지 (2)
Develop History
2023-01-27 08:59 게시 8de3be31daa1b13ef3c9

0
0
79
이 페이지는 외부 공간에 무단 복제할 수 없으며 오직 있는 그대로 게시되며 부정확한 내용을 포함할 수 있습니다. 법률이 허용하는 한 가이드 라인에 맞춰 게시 내용을 인용하거나 출처로 표기할 수 있습니다.
This page is not to be distributed to external services; it is provided as is and may contain inaccuracies.
이번 목표
보이스 녹음 및 더빙 프로그램에 필요한 주요 클래스가 무엇인지 탐색하고 구성 해 보기로 한다.
그 결과를 클래스 다이어그램으로 구성함으로써 추후 프로그램을 개발할 때 소요되는 시간을 절약하고 유지 보수를 용이하게 한다.
주요 클래스 다이어그램
기본적으로 목소리를 녹음하는 건, 단순히 한 문장을 녹음하기 보다, 특정 장면에 대해서, 특정 시간에 대해 목소리를 구성할 수 있다. 예를 들어 주인공 A와 주인공 B가 서로 투닥투닥하는 장면이 있다고 할 때, 사용자Actor은 장면 "투닥거리는 장면"을 생성하고 그 안에 투닥 거리는 목소리 보이스들을 녹음 해 넣을 수 있다. 즉 하나의 보이스들을 의미하는 객체가 필요하며, 이 객체의 상위 부모 객체를 Obj로 임의 구성하였다.

엔티티 오브젝트
목소리를 녹음하거나 삽입하다보면 해당 타임라인에 여러가지 오브젝트를 넣을 필요가 생기는데, 이러한 오브젝트들은 Sound Annotation Image 로 구별한다.

엔티티 오브젝트
하지만 여기서 고려해야 할 사항은, 트랙이 여러개 존재할 수 있다는 것이며, 각 트랙 안에 오브젝트가 나열될 수 있기 때문에, 트랙 내에 여러 개의 Obj가 존재할 수 있도록 구성한다.

엔티티 오브젝트
여기서 한 가지 신경 써야 할 점은, 보이스나 이미지 데이터는 메모리로 로드 되었을 때 높은 용량을 차지하기 때문에 동적인 관리가 필요하다. 따라서 AudioData ImageData는 상위 데이터 관리자 Class를 만들어 이 클래스로부터 데이터를 가져오되, 실시간 메모리가 필요한 경우가 아니라면 파일로부터 데이터를 가져올 수 있도록 관리한다. 따라서 별도의 데이터 클래스를 만들고 이 클래스를 참조하도록 구성한다.

전반적인 구성
상기 그림에 AudioData ImageData 가 추가 되었는데, 이는 시스템 상에 존재 할 수 있으며, 여러 Obj에 동시에 참조될 수 있다. (단 ImageObj에 ImageData가 Attribute로 들어가 있는데 이를 지우고 사실상 Relation으로 봐야 한다.) 예를 들어서 장면 구성에서 같은 장면을 여러 번 사용하거나, 다른 분기에 따라 같은 음성 녹음 본이 사용될 수 있다는 점을 고려했다. 예를 들면 다음과 같다.
장면 1
A : 나... 배고파
B : 여기 고구마 있어 먹을래?
"먹는다"를 선택한 경우
A : 헉... 고구마다
A : 어... 먹을래...
"안 먹는다"를 선택한 경우
A : 헉... 고구마다
A : 어...음... 됐어...
B : 정말? 내가 다 쳐먹는다!..
위 상황에서, 해당 소프트웨어를 이용해 더빙을 구성한다고 할 때, 장면 1에서의 분기에 따라 등장 인물 A헉... 고구마다의 음성은 동일하다. 이런 경우 음성을 별도로 두 번 오브젝트로 가지고 있으면 공간 상 비효율적이기 때문에 이를 중복 적으로 참조할 수 있도록 인스턴스를 하나만 만들어 관리할 수 있도록 한다.
결과적으로 인스턴스 목록은 다음과 같다.
장면 1 내 인스턴스
- Track 1 인스턴스
SoundObj [0]나... 배고파
SoundObj [1]여기 고구마 있어 먹을래?
장면 2 내 인스턴스
- Track 1 인스턴스
SoundObj [2-1]헉... 고구마다
SoundObj [3]어... 먹을래...
장면 3 내 인스턴스
- Track 1 인스턴스
SoundObj [2-2]헉... 고구마다
SoundObj [4]어... 음... 됐어...
SoundObj [5]정말? 내가 다 쳐먹는다!..
Data Instances
AudioData [0]나... 배고파
AudioData [1]여기 고구마 있어 먹을래?
AudioData [2]헉... 고구마다
AudioData [3]어... 먹을래...
AudioData [4]어... 음... 됐어...
AudioData [5]정말? 내가 다 쳐먹는다!..
주의 할 점은 SoundObj 자체는 서로 다른 인스턴스이다. 왜냐하면 다른 장면에 들어가는 다른 오브젝트이기 때문, 다만 이 오브젝트에 필요로 하는 AudioData 는 같은 Audio를 참조하게 되는 것 이다. 실제 Data Instances 를 보면 AudioData [2]는 하나만 존재하며 버퍼를 같이 사용하게 된다.
이러한 과정을 목표로, 마저 진행하기로 한다.
댓글 0개
댓글은 일회용 패스워드가 발급되며 사이트 이용 약관에 동의로 간주됩니다.
확인
Whitmemit 개인 일지 블로그는 개인이 운영하는 정보 공유 공간으로 사용자의 민감한 개인 정보를 직접 요구하거나 요청하지 않습니다. 기본적인 사이트 방문시 처리되는 처리 정보에 대해서는 '사이트 처리 방침'을 참고하십시오. 추가적인 기능의 제공을 위하여 쿠키 정보를 사용하고 있습니다. Whitmemit 에서 처리하는 정보는 식별 용도로 사용되며 기타 글꼴 및 폰트 라이브러리에서 쿠키 정보를 사용할 수 있습니다.
이 자료는 모두 필수 자료로 간주되며, 사이트 이용을 하거나, 탐색하는 경우 동의로 간주합니다.