최신 뉴스 (KO)

새로운 인공 지능은 오디오를 휴대폰의 구조화된 텍스트로 변환합니다.

Nothing phone 3
사진: Nothing phone 3 - Reprodução Youtube

스마트폰 제조사인 아무것도스(Nothing)가 최신 기기에 인공지능을 기반으로 한 새로운 도구를 배포하기 시작했다. 전례 없는 기능은 사용자가 작은 화면에서 타이핑과 상호 작용하는 방식을 바꿀 것을 약속합니다. 새로운 기능은 운영 체제 업데이트를 통해 Phone(3) 모델에 처음 제공됩니다.

Essential Voice라고 불리는 이 기술은 음성 명령을 즉시 전송할 수 있는 구조화된 텍스트로 변환합니다. 시스템은 장치에 설치된 애플리케이션과 통합된 방식으로 작동합니다. 기존 받아쓰기와 달리 이 메커니즘은 언어 결함을 필터링하고 문장을 자동으로 구성합니다. 회사는 앞으로 몇 주에 걸쳐 다른 제품 라인으로 기능을 확장할 계획입니다.

전화 없음
전화 없음 – 사진 : 재생산

인공지능이 오디오를 깨끗한 텍스트로 바꾸는 방법

Essential Voice의 작동은 Essential Space로 알려진 혁신 패키지의 일부입니다. 플랫폼은 Gemini 3 Flash 언어 모델을 사용하여 휴대폰 마이크에서 캡처한 정보를 처리합니다. 사용자가 말하면 시스템은 화면에 단어를 복사하기 전에 메시지의 일반적인 맥락을 이해합니다. 최종 결과에서는 인간의 말에서 흔히 볼 수 있는 머뭇거림의 표현이 사라집니다.

제조업체의 주요 목표는 음성 통신을 실행 가능하고 전문적인 대안으로 만드는 것입니다. 사람은 길을 걷는 동안 긴 이메일을 받아쓰게 할 수 있습니다. 소프트웨어는 특정 명령 없이도 올바른 문법 규칙을 적용하고 적절한 구두점을 삽입합니다. 어떤 상황에서는 시스템 자체가 콘텐츠의 형식을 정리된 단락으로 구성합니다.

시스템 활성화는 두 가지 간단하고 직접적인 방법으로 이루어집니다. 사용자는 물리적인 에센셜 키를 길게 누르거나 가상 키보드 하단에 위치한 전용 아이콘을 탭할 수 있습니다. 상대방이 말을 멈추는 순간 녹음이 종료됩니다. 처리된 텍스트는 열려 있는 애플리케이션의 입력 필드에 즉시 나타납니다.

브랜드 기기 업데이트 일정

운영 체제의 안정성을 보장하기 위해 리소스가 점진적으로 해제됩니다. Nothing Phone (3) 소유자는 이제 장치의 설정 메뉴를 통해 새로운 기능을 다운로드할 수 있습니다. 설치 패키지에는 빌드 번호 Metroid-B4.1-260408-1909-IND가 있습니다. 장치를 다운로드하고 다시 시작하면 도구를 즉시 사용할 수 있습니다.

브랜드의 최근 포트폴리오에 포함된 다른 장치에도 기술 수신 날짜가 정의되어 있습니다. Phone(4a) Pro 모델은 2026년 4월 말 업데이트가 예정되어 있습니다. Standard Phone(4a) 사용자는 5월 초까지 기다려야 합니다. 회사는 이전 세대 스마트폰과의 호환성에 대한 정보를 제공하지 않았습니다.

소프트웨어 업데이트는 Nothing OS 인터페이스에 다른 작은 개선 사항도 제공합니다. Glyph 후방 조명 시스템에 대한 조정은 메인 패키지와 함께 제공됩니다. 그러나 이 버전의 가장 큰 특징은 새로운 음성 도구를 통해 생성된 생산성에 여전히 초점을 맞추고 있다는 것입니다.

일상적인 사용에서 도구의 주요 장점

제조업체의 공식 문서에는 새로운 전사 기술에 내장된 일련의 기능이 자세히 설명되어 있습니다. 이 메커니즘은 터치 스크린의 빈번한 수동 수정으로 인해 낭비되는 시간을 없애기 위해 노력합니다.

  • 자동 음성 감지 시스템으로 100개 이상의 언어를 기본적으로 지원합니다.
  • 보조 애플리케이션을 사용하지 않고 캡처한 오디오를 외국어로 동시 번역합니다.
  • 양식을 작성하거나 반복 링크를 삽입하기 위한 맞춤형 보컬 바로가기를 만듭니다.
  • 지속적인 받아쓰기를 작업 목록이나 특정 메모로 변환할 수 있는 지능형 구조화입니다.
  • 텍스트 입력 필드가 있는 모든 타사 응용 프로그램에서 보편적으로 작동합니다.

이러한 기능은 도구를 일반적인 가상 비서와 다른 범주에 배치합니다. 생산성과 매우 정확한 서면 콘텐츠 생성에 중점을 두고 있습니다.

데이터 개인정보 보호 및 처리 요구 사항

시스템 아키텍처가 제대로 작동하려면 지속적인 인터넷 연결이 필요합니다. 대규모 인공 지능 처리는 휴대폰의 로컬 하드웨어가 아닌 클라우드의 서버에서 이루어집니다. 모바일 네트워크나 Wi-Fi에 접속하지 않으면 스마트 받아쓰기 버튼이 비활성화됩니다. 전사 속도는 사용 시 사용 가능한 신호 품질에 따라 직접적으로 달라집니다.

정보 보안 문제는 프로젝트 개발 과정에서 특별한 관심을 받았습니다. 변환 후 오디오 파일이 데이터베이스에 저장되어 있지 않다는 것을 보장하는 것은 없습니다. 소리는 클라우드로 이동하여 Gemini 모델 디코딩을 거쳐 스마트폰에 텍스트로 반환됩니다. 전체 프로세스를 완료하는 데는 몇 분의 1초밖에 걸리지 않습니다.

장치의 마이크는 대부분의 시간 동안 꺼져 있습니다. 활성 청취는 사용자가 명령을 수동으로 트리거할 때만 시작됩니다. 이 접근 방식은 불필요한 배터리 소모를 방지하고 비공개 환경에서 대화가 실수로 캡처되는 것을 방지합니다.

기존 키보드와의 실질적인 차이점

기존 가상 키보드는 마이크가 캡처하는 모든 내용을 문자 그대로 기록합니다. 사람이 말을 더듬거나 단어를 반복하면 오류가 똑같은 방식으로 화면에 나타납니다. Essential Voice는 실시간 교정자 역할을 하여 이러한 패턴을 깨뜨립니다. 알고리즘은 문장의 의도를 이해하고 세련된 결과를 제공합니다.

초기 버전을 테스트한 기술 전문가들은 추가 버전의 필요성이 크게 감소했다고 보고했습니다. 텍스트 출력은 자연스럽게 더 형식적이고 직접적인 톤을 갖습니다. 이 기능은 기업 문서, 전문 이메일 및 업무 보고서 작성에 매우 유용합니다. 화자가 조용한 환경에서 단어를 명확하게 표현할 때 정확성 수준은 인상적입니다. 인공지능은 약간의 배경 소음이 있어도 상황을 식별할 수 있습니다.

그러나 과도한 형식은 일상적인 의사소통의 특정 맥락에서 조정이 필요할 수 있습니다. 시스템이 모든 속어와 자연스러운 일시 중지를 제거하면 메시징 앱에서 가족과의 편안한 대화가 인위적으로 들릴 수 있습니다. 제조업체는 알고리즘의 이러한 동작 특성을 인식합니다. 회사 엔지니어들은 향후 소프트웨어 업데이트에 다양한 유형의 사회적 상호 작용에 맞게 글쓰기를 조정하기 위한 수동 톤 조정이 포함될 수 있다고 제안합니다.

↓ Continue lendo ↓