AI-Hands는 AIWander에서 개발한 오픈 소스 Windows 유틸리티로, 웹캠 기반 제스처 인식을 사용하여 터치 없는 데스크탑 제어를 가능하게 합니다. 이 앱은 실시간 손 추적 및 MediaPipe의 랜드마크 감지를 통해 라이브 웹캠 입력을 마우스 및 키보드 동작으로 변환하며, 커서 매핑, 제스처 클릭, 스크롤 및 미디어 제어를 포함합니다. 조정 가능한 민감도와 시각적 오버레이를 통해 사용자가 동작을 보정할 수 있습니다. 이 앱은 기술 애호가, 접근성 사용자 및 원거리에서 핸즈프리 PC 탐색이 필요한 발표자를 대상으로 합니다.
이 도구는 표준 웹캠을 직접 커서 및 제스처 입력으로 변환합니다.
실시간 손 추적 및 랜드마크 감지를 위해 MediaPipe를 사용하여, 앱은 검지 손가락을 커서 이동에 매핑하고 특정 손 자세를 클릭, 스크롤 및 미디어 제어로 변환합니다. 주요 제어는 다음과 같습니다:
손끝 위치에 매핑된 커서
제스처 기반의 왼쪽, 오른쪽 및 더블 클릭
가상 스크롤 및 미디어/볼륨 명령
사용 중 감지된 랜드마크와 활성 제스처를 보여주는 시각적 오버레이가 있습니다.
구현은 데스크탑 시스템에서 CPU 및 메모리 영향을 적당하게 유지합니다.
개발자는 경량 Python 구현과 최적화된 모델로 도구를 구축하여, 다른 애플리케이션과 함께 실행할 수 있도록 하여 상당한 오버헤드를 피했습니다. 소스 릴리스는 Python 3.x 환경을 요구하며, 간단한 배포를 위해 독립 실행형 실행 파일 릴리스가 제공될 수 있습니다. 이 도구는 현재 Windows 데스크탑을 대상으로 하며 입력을 위해 작동하는 웹캠이 필요하며, 전용 적외선 또는 깊이 센서가 필요하지 않습니다.
오픈 소스 배포는 투명성을 높이지만 카메라 권한과 좋은 조명이 필요합니다.
이 프로젝트는 GitHub에 호스팅되어 있어 사용자가 소스 코드를 검사하고 보안 감사 또는 사용자 정의를 위해 동작을 수정할 수 있습니다. 이 도구는 웹캠 접근을 요구하며 카메라가 손을 볼 수 있는 능력에 의존합니다; 신뢰할 수 있는 추적을 위해서는 중간 조명이 권장됩니다. 제스처가 실제 마우스 및 키보드 이벤트로 변환되기 때문에, 사용자는 중요한 시스템 작업을 할당하기 전에 안전한 환경에서 매핑을 테스트해야 합니다.
이 도구는 캐주얼한 접근성과 더 깊은 사용자 지정을 위한 조정 곡선을 균형 있게 제공합니다.
조정 가능한 민감도와 피드백 오버레이는 초기 조정에 도움을 주지만, 더 고급 구성은 구성 파일이나 Python 설정에 대한 친숙함이 필요할 수 있습니다. 발표자와 접근성 사용자는 거리에서 실용적인 핸즈프리 제어를 얻는 반면, 경쟁 게임 및 기타 정밀 민감 작업은 입력 지연의 영향을 받습니다. GitHub의 커뮤니티 기여는 행동을 확장하고자 하는 사용자들을 위해 제스처 매핑 및 사용자 정의 옵션을 확장합니다.
시연 및 접근성을 위한 실용적인 선택, 정밀 의존 작업에는 적합하지 않음.
이 도구는 거리 제어와 실험을 중요시하는 사용자에게 보상을 제공하며, 프레젠테이션 및 보조 시나리오를 위한 작업 가능한 핸즈프리 옵션을 제공합니다. 제스처 입력이 직접 주변 장치의 반응과 일치하지 않기 때문에 시간에 민감한 작업에서는 절충이 필요합니다. 이 프로젝트는 커뮤니티 개발의 혜택을 받으므로 주기적인 조정을 견딜 수 있는 사용자가 가장 큰 혜택을 누릴 수 있습니다. 추천합니다.