
최근 연구에서 중국 연구자들은 전체 시야에 걸쳐 광범위한 인식을 유지하면서 관심 영역(ROI)에 고해상도 감지를 동적으로 집중시켜 인간 눈의 초점을 모방하는 칩{0}}규모 LiDAR 시스템을 개발했습니다.
해당 연구는 저널에 게재되었습니다.네이처커뮤니케이션즈.
LiDAR 시스템은 레이저 빔을 발사하여 밀리미터 단위의 정밀도로 3D 장면을 매핑함으로써 자율 주행 자동차, 드론, 로봇의 머신 비전을 강화합니다. 눈은 중심와(예리한 중앙 시력 지점)에 가장 밀도가 높은 센서를 모아 중요한 곳으로 시선을 돌립니다. 대조적으로, 대부분의 LiDAR은 모든 곳에 균일한(종종 거친) 해상도를 퍼뜨리는 고정 평행 빔 또는 스캔을 사용합니다. 디테일을 강화한다는 것은 더 많은 채널을 균일하게 추가하는 것을 의미하며, 이는 비용, 전력 및 복잡성을 폭발적으로 증가시킵니다.
팀의 디자인은 눈의 약 0.017도 한계보다 두 배 더 선명한 ROI에서-'망막 너머' 각도 해상도 0.012도를 달성합니다. 이는 시스템이 먼 도로 표지판에서 미세한 세부 사항을 찾아내는 것과 같이 가장 작은 각도로 분리된 지점을 구별할 수 있음을 의미합니다. 필요에 따라 병렬 감지 채널을 재할당하여 비용이 많이 드는 무차별- 확장을 방지합니다.
Phys.org는 해당 연구의 공동 저자인 Peking University 전자공학부의 Ruixuan Chen 및 Xingjun Wang과 이야기를 나눴습니다.
“동기는 생물학적 인식과 기계 인식 사이의 실질적인 불일치에서 비롯됩니다.”라고 연구원은 설명했습니다. "인간의 눈은 주의를 재분배하여{1}}광범위한 인식을 유지하면서 중요한 것에 자원을 집중함으로써 높은 예민함과 에너지 효율성을 달성합니다. 이와 대조적으로 LiDAR 해상도는 '어디서나 더 많은 채널'에 의해 추구되는 경우가 많으며 이는 빠르게 비용이 많이 들고 전력이 부족해집니다.-
스케일링 문제
머신 비전 시스템은 기존 카메라를 넘어 정확한 거리 측정과 3D 환경 인식을 가능하게 하는 LiDAR 센서를 포함하도록 확장되었습니다. 그러나 패시브 카메라와 달리 LiDAR는 달성 가능한 해상도를 제한하면서 모든 픽셀에 대해 방출 및 수신 하드웨어를 요구합니다.
LiDAR 해상도를 개선하기 위한 현재의 접근 방식은 심각한 병목 현상에 직면해 있습니다. 채널 복제는 선형적인 해상도 이득을 제공하지만 복잡성, 전력 및 비용의 초선형 폭발을 유발합니다.
"첫째, 해상도는 하드웨어 채널 수 및 스캐닝 메커니즘과 밀접하게 연결되어 있습니다. 둘째, LiDAR는 능동형 센서입니다. 모든 픽셀은 전송 및 수신 리소스 비용을 효율적으로 소모합니다."라고 연구원은 설명했습니다. "눈-안전 제약 조건을 충족하면서 광 전력, 수신기 감도 및 디지털화 대역폭을 관리해야 하기 때문에 적응형 포커싱이 수동 이미징보다 근본적으로 더 어렵습니다."
응집성 주파수-변조 연속파 LiDAR의 경우 이러한 문제는 특히 심각합니다. 각 일관된 채널에는 안정적인 주파수 제어, 정교한 수신 하드웨어 및 엄격한 보정이 필요합니다. 이로 인해 대규모 채널 중복을 경제적으로 정당화하기가 훨씬 더 어려워졌습니다.
생체모방 솔루션
연구원의 솔루션은 두 가지 핵심 기술을 결합합니다. 여기에는 튜닝 범위가 100nm가 넘는 민첩한 외부-공동 레이저(ECL)와 박막 리튬 니오베이트(TFLN) 플랫폼을 기반으로 구축된 재구성 가능한 전기{3}}주파수 빗이 포함됩니다.
ECL은 일관된 거리 측정을 위해 고품질 FMCW 처프 신호를 제공하고 파장-제어 빔{2}}조정 메커니즘 역할을 합니다. 중심 파장을 조정함으로써 시스템은 넓은 시야 내에서 시야 방향을 빠르게 바꿀 수 있습니다.
그런 다음 전기{0}} 빗은 동일한 처프 레이저 소스에서 여러 개의 병렬 FMCW 캐리어를 생성합니다. 결정적으로 무선 주파수 구동 조건을 조정하면 콤 간격이 변경됩니다.
"이것이 '확대/축소'를 가능하게 하는 것입니다.{0}}광학 장치를 변경하거나 채널을 추가하지 않고도 선택한 영역의 점 밀도를 높이거나(더 미세한 샘플링) 밀도를 완화할 수 있습니다(더 거친 샘플링)."라고 연구진은 덧붙였습니다.
이 시스템은 연구원들이 "마이크로-병렬성"이라고 부르는 방식을 사용합니다. 이는 적절한 수의 물리적 채널을 사용하여 동적 위치 조정을 통해 훨씬 더 많은 스캐닝 라인을 달성하는 것을 의미합니다.
실험적 검증
팀은 세 가지 실험 시나리오에서 시스템 기능을 시연하여 초점 영역에서 인간 망막의 공칭 한계를 초과하는 0.012도 각도 해상도를 달성했습니다.{1}}
정적 장면 이미징에서 시스템은 전체 시야--스캔의 경우 54 x 71픽셀 해상도, 로컬 초점 스캔의 경우 17 x 71픽셀 해상도로 시뮬레이션된 도로 환경을 캡처했습니다. 이러한 집중 스캔은 수직 세부 밀도를 4배로 늘려 이전에는 보이지 않았던 장애물을 드러냈고, 90%의 포인트가 1.3cm 미만의 정확도로 표시되었습니다.
연구원들은 또한 LiDAR-카메라 융합을 시연하여 정확한 3D 기하학과 RGB 모양 데이터를 결합하는 색상화된 포인트 클라우드를 생성했습니다. 표준 스캔과 초점 스캔을 비교할 때 색상 히스토그램 정렬이 약 10% 향상되어 3D 포인트와 이미지 픽셀 간의 일치성이 향상되었음을 나타냅니다.
연구원들은 "LiDAR를 카메라와 융합함으로써 색상화된 포인트 클라우드를 생성하고 장면 표현을 풍부하게 하여 해석 가능성을 향상시키고 질감 및 의미 단서에 의존하는 다운스트림 인식 작업을 지원합니다"라고 설명했습니다.
아마도 가장 인상적인 점은 각 지점이 위치, 회전 속도, 표면 반사율 및 색상을 동시에 보여주는 농구 던지기를 실시간-4D-와 이미지-로 캡처했다는 것입니다. 넓은 시야각에 걸쳐 8Hz에서 표준 3D LiDAR에서는 보이지 않는 동작 패턴이 드러났습니다.
실험 작업을 통해 향후 개발 경로를 알려주는 중요한 시스템 수준의 절충안이 밝혀졌습니다.{0}
"가장 분명한 것은 각도 해상도와-채널당 측정 헤드룸 간의 긴장 관계입니다."라고 연구진은 말했습니다. "병렬 일관성 판독에서 각 채널은 겹치지 않는 자체 전기 대역을 점유해야 합니다.-반복 속도를 줄이면 실제로 각도 샘플링을 더 세밀하게 할 수 있지만 실험에 따르면 채널당 판독 대역폭도 압축되는 것으로 나타났습니다.-
팀은 실제 배포를 위해 기술을 발전시키기 위한 몇 가지 우선 순위 방향을 식별했습니다. 여기에는 TFLN 플랫폼의 더욱 심층적인 모놀리식 통합, 향상된 범위 해상도를 위한 초광대역 스위프 소스 개발, 이벤트 기반 인식을 위한 폐쇄형{2}}루프 주의 정책 구현-이 포함됩니다.
광섬유 링크를 사용하는 현재 실험에서는 재료 분류 기능을 제한하는 분극 불안정성이 발생합니다.
연구원들은 "그러나 우리는 모놀리식 통합이 이러한 병목 현상을 근본적으로 해결할 것이라고 생각합니다"라고 말했습니다. "불안정한 광섬유 경로에서 제한된-칩 도파관으로 전환함으로써 우리는 안정적인 편파 복구를 달성할 수 있습니다."
생체공학 LiDAR 시스템은 자율주행차, 공중 및 해상 드론, 로봇공학, 뉴로모픽 비전 시스템에 걸쳐 잠재적인 응용 분야를 제공합니다. 연구진에 따르면 LiDAR 외에도 재구성 가능한 빗은 광통신, 일관성 단층 촬영, 압축 감지 및 정밀 계측을 위한 빠른 스펙트럼 분석을 가능하게 합니다.









