complex-YOLO 3D object Detection on Point Clouds

2024. 4. 1. 20:21파이썬

이 연구는 신뢰할 수 있는 각도 회귀를 위해 새로운 E-RPN을 사용하여 Complex-YOLO를 소개한다.

• 우리는 현재 주요 모델보다 5배 이상 빠르면서도 KITTI 벤치마크 스위트에서 평가한 높은 정확도의 실시간 성능을 제시합니다.

• E-RPN의 지원을 받아 각 3D 상자의 정확한 헤딩을 추정하여 주변 객체의 궤적을 예측할 수 있습니다.

• 다른 Lidar 기반 방법과 비교하여, 우리의 모델은 한 번의 전진 경로에서 모든 클래스를 효율적으로 동시에 추정합니다.

 

Bird's - eye View (BEV)

  • 조감도
  • 새가 하늘에서 내려다 보는 것과 같이 표현한 그림
  • Lidar 데이터에서는 Point Cloud 데이터를 XY projection하여 나타낸 프레임

Bird's - eye View(BEV)

Architecture

YOLO 모델에 E-RPN(Euler Region Proposal Network)가 붙은 구조

  • YOLO 모델 입출력
  • input : 1024 x 512 x 3 (BEV RGB Map)
  • output: 32 x 16 x 75
  • 75 = 5 x (6 + 1 + 3 + 5)
  • prior 개수 x ((Tx, Ty, Tw, Tl, Tim, Tre)(위치, 크기, 각도) + confidence score + class probability + (a, Cx, Cy, Pw, Pl))

Euler - Region - Proposal에 대한 설명

 

AP Performance - Birds - Eye - View Detection

성능면에서 다른 Method보다 월등하진 않지만 FPS면에서 훨씬 빠르다.

AP Performance - 3D Object Detection

3D Object Detection면에서도 비슷한 결과를 얻을 수 있었다.

Conclusion

본 논문에서는 Lidar 기반 포인트 클라우드를 이용한 실시간 효율적인 딥러닝 모델로 3D 객체 감지의 첫 번째를 제시합니다.

• KITTI 벤치마크 스위트에서 뛰어난 50fps 이상의 효율성과 함께 정확도 면에서의 최첨단 결과를 강조합니다 (NVIDIA Titan X).

• 대부분의 선도적인 접근법과 달리 우리는 추가적인 센서, 예를 들어 카메라가 필요하지 않습니다.

• 새로운 E-RPN의 도입에 의해 복소수를 이용한 오일러 회귀 접근법으로 방향을 추정하여 이런 획기적인 결과를 달성합니다.

• 특이점 없는 폐합된 수학적 공간을 통해 강력한 각도 예측이 가능합니다.

• 우리의 접근법은 한 번의 전진 경로에서 여러 클래스의 객체를 동시에 감지할 수 있습니다.

• 이러한 창의성은 자율 주행 자동차에서의 실제 사용에 배치할 수 있게 합니다.

또한 다른 모델과 명확하게 구별됩니다.

• 우리는 실시간 능력을 NVIDIA TX2 (4fps)와 같은 전용 임베디드 플랫폼에서도 보여줍니다.

'파이썬' 카테고리의 다른 글

DMS  (0) 2024.04.22
건물 영역 검출 - DeepLabV3+  (0) 2024.04.16
YOLOv8 도로 표지판, 신호등 검출  (0) 2024.03.17
YOLO v8을 이용한 마스크 검출  (0) 2024.03.17
facelandmark - 황금 비율 측정(PFLD)  (0) 2024.02.25