2021-01-14
출원번호16 /0 00, 248
출원일자2018.06.05
출원인Tesla , Inc .
등록번호(일자)US 10 , 416 , 899 B2(2019.09.17)
발명의 명칭SYSTEMS AND METHODS FOR LOW LATENCY HARDWARE MEMORY MANAGEMENT


 최근 IT기업들과 자동차기업들이 자율주행자동차 시장을 선점하기 위해 노력하고 있다. 자율주행자동차의 핵심기술에는 자율주행 소프트웨어 플랫폼이 자리잡고 있다. 자율주행자동차 시대에는 하드웨어 기술보다 자율주행기술을 구현하는 것이 소비자가에게 더 중요한 선택 기준으로 인식된다. 따라서 자율주행차가 보급화되는 시점에 소프트웨어 브랜드 파워가 점점 커짐에 따라 하드웨어 제조업체를 위협하고 있다.

 이에 하드웨어 공급회사는 레이더와 라이다의 센서를 조합한 새로운 하드웨어를 개발하는데 집중하고 있다 (그림 1). 하드웨어 제조회사들은 현재 상황을 타개하기 위해 기술개발을 거듭하여 하드웨어 간소화와 기술 고도화를 위해 투자하고 있다.  


그림 1. 자율주행차량의 하드웨어


  본 특허는 일반적인 메모리 관리 시스템과 달리 하드웨어 가속 프로세서의 요구 사항에 따라 특정 작업을 수행하도록 설계된 메모리 관리 시스템에 대한 내용이다.

 그림 2는 일반적인 메모리 관리 시스템을 보여준다. 시스템 (100)은 일반적으로 범용 컴퓨터 시스템, 제어기 (106) 및 메모리 (110)의 모노리식 칩 (monolithic chip)에서 구현되는 중앙 처리 장치 (CPU) (104)를 포함한다. CPU (104)는 이미지 데이터 (102)를 수신하고 처리하는 일반 프로세서이며, 이미지 데이터 (102)는 이진수로 표현되고 데이터 (114)의 그룹 또는 블록으로 처리되는 다수의 픽셀을 포함하는 파일이다. CPU (104)에 의한 기록 명령 수신에 응답하는 메모리 제어기 (106)가 이미지 데이터 (102)를 다양한 개별 저장 위치에 저장 될 수 있는 작은 크기 (114)로 분할되어 있으며, 이는 메모리 (110)를 분산화 할 수 있도록 블록으로 그룹화한다. 메모리 (110)는 물리적인 메모리 장치이며, 이미지 데이터 (102)를 메모리 (110)에 저장하려면 비교적으로 많은 수의 포인터 (124)를 사용해야 한다. 각 포인터 (114)는 이미지 데이터 (102)의 일부를 저장하기 위해 특정 메모리 블록 (124) 또는 메모리 블록 (124) 내 위치를 지정한다. 예를 들어, 첫 번째 포인터 (124)는 첫 번째 블록 (114)를 읽고, 두 번째 포인터 (126)은 두 번째 블록 (116)의 순서대로 이미지 데이터 (102)를 전부 다 읽을 때까지 수행한다.


그림 2. 일반적인 메모리 관리 시스템


 그림 3은 매트릭스 프로세서와 같은 하드웨어 가속 프로세서로 데이터를 매핑하기 위한 메모리 관리 시스템을 보여준다. 시스템 (200)은 하드웨어 가속 프로세서의 하드웨어 요구 사항에 따라 특정 작업을 수행하도록 설계된 특수 목적을 위한 컴퓨터 시스템의 구성 요소를 나타낸다. 시스템 (200)은 메모리 (202), 제어 로직 (208), 캐시/버퍼 (210), 시퀀서 (212), 포맷터 (214), 및 매트릭스 프로세서 (216)으로 구성되어 있다. 메모리 (202)는 알려진 임의의 유형의 메모리이다. 여기서 특정 서브 블록을 포맷터 (214)에 입력하기 위해 캐시/버퍼 (210)가 필요하다. 제어 로직 (208)은 고정된 데이터 블록 (204)과 파라미터 세트 (204)의 세트를 시퀀서 (212)에 제공한다. 여기서 시퀀서 (212)는 가상화된 메모리 맵, 블록 크기 대 벡터 정렬기 및 블록 카운트 대 데이터 구조 계산기를 저장 및/또는 인터페이스 할 수 있는 요소들로 구성되어 있다 (그림 4). 이는 데이터를 읽기 위한 주소를 생성하고, 결과를 기록하고, 컨볼루션 연산을 수행할 때 시스템 (200)의 상태를 파악하는데 사용된다. 포맷터 (214)는 2차원 또는 3차원 데이터를 행 또는 열로 표현할 수 있는 단일 벡터 또는 문자열로 변환한다. 즉, 포맷터 (214)가 메모리 (202)로부터 검색된 데이터의 일부 또는 전부를 선형으로 나타낼 수 있다. 매트릭스 프로세서 (216)가 메모리 (202)로부터 데이터를 다시 액세스하고 전송할 필요 없이 피연자 함수 (operands)를 재사용한다.


그림 3. 특정 작업을 수행하도록 설계된 메모리 관리 시스템


그림 4. 시퀀서의 구성 요소들


그림 5는 메모리 관리를 위한 프로세스의 흐름도를 보여준다. 파라미터 세트에 기초하여 고정된 프로그램이 가능한 블록 길이의 데이터 블록은 메모리 맵에 따라 메모리에 저장된다 (402). 다음 단계 (404)에서 읽기 요청에 응답하여 요청과 관련된 데이터의 길이 및 주소 포인터를 찾는다. 예를 들어, 주소 포인터가 읽기 요청에 해당하는 메모리에서 첫 번째 데이터 블록의 초기 위치를 확인해본다. 단계 (406)에서 블록 길이, 입력 길이 및/또는 메모리 맵을 기반으로 메모리로부터 검색되는 데이터 블록의 수를 나타내는 블록의 숫자가 판독 요청을 만족시키기 위해 총 블록 길이를 계산한다. 데이터 블록은 하나 이상의 주기로 메모리에서 검색되며, 그 수는 데이터 블록 또는 데이터 블록 내 데이터가 연속 여부에 따라 달라진다 (408).


그림 5. 메모리 관리를 위한 프로세스


  테슬라는 자율주행기술을 위한 소프트웨어를 이용한 기술 개발뿐만 아니라 하드웨어 기술도 개발을 동시에 수행하고 있다. 자율주행 소프트웨어 플랫폼을 구현할 수 있도록 하드웨어의 메모리 효율성 관리를 통해 가속화하여 더 많은 이미지 데이터를 빠르게 처리할 수 있도록 제안하였다. 이를 통해, 메모리 내 연산을 위해 사용되지 않는 영역이 감소함에 따라 목적에 적합하게 사용할 수 있게 되었다. 하드웨어 가속 프로세서는 현재 자율주행기술을 구현하기 위해 개발되었지만, 추후에 데이터를 빠르게 처리하기 위한 기술이 요구되는 다양한 분야에 사용될 수 있을 것으로 전망된다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670


2021-01-14
출원번호15 / 637,313
출원일자2017.06.29
출원인Tesla , Inc.
등록번호(일자)US 10,510,195 B2(2019.12.17)
발명의 명칭

SYSTEM AND METHOD FOR MONITORING STRESS CYCLES


 지속적인 차량 내 터치스크린 문제가 보고 되었기 때문에 2020년 6월 미국 도로교통안전국 (NHTSA)가 일부 테슬라 모델S에 대해 조사를 돌입하였다. 테슬라는 차량 내 물리버튼을 없애고 대형 터치스크린 내 대부분의 제어기능을 통합하였다. 테슬라 차량 내 터치스크린이 작동하지 않게 되면 각종 인포테인먼트 기능, 내비게이션, 웹 브라우저 및 후방카메라 등이 사용할 수 없게 된다. NHTSA는 문제의 원인이 메모리 컨트롤 유닛에서 발생한 것으로 봤다. 플래시 메모리 장치는 프로그램의 수나 지우는 주기에 따라 수명이 한정적으로 된다. 이로 인해 전원 공급이 길어지고, 터피스크린 부팅이 오래 걸리고, 통신 연결이 끊김 등 성능 저하로 보이는 현상들이 나타난 뒤 문제가 발생할 가능성이 있다고 NHTSA의 관계자는 언급하였다.


그림 1. 테슬라 모델S 터치스크린의 모습


 본 특허는 앞 문단에서 발생한 문제가 발생하기 전에 테슬라에서 메모리의 스트레스에 관해서 인지를 하고 있었는지 문제를 해결하기 위해 실험을 진행하였고 이에 대한 내용이다.

 그림 2는 스트레스 주기의 성쇠를 모니터링 하기 위한 낙수계수법 (rainflow counting) 기법 시스템 (100)의 다이어그램이다. 시스템 (100)의 순서 및 특성을 기반으로 차량 (110)의 일부에 통합된다. 차량 (110)은 자동차, 오토바이 등과 같은 육상에서 이동할 수 있는 운송 수단들이 포함된다. 차량 (110)은 다수의 서브 시스템 (121-129)을 포함한다. 예를 들어, 서브 시스템 (121-129)는 배터리, 구동 장치, 섀시, 조향 시스템, 차 내부, 전자 제품 및 타이어으로 구성된다. 서브 시스템 (121-129)에는 서브 시스템 (121-129) 내 부착된 하나 이상의 스트레스 센서 (131-139)를 이용하여 스트레스를 모니터링 한다. 프로세서 (140)는 서브 시스템 (121-129)에 부과된 스트레스 사이클을 모니터링하거나 누적된 손상을 알아낸다. 또한, 프로세서 (140)는 네트워크 (170)을 통해 서비스 센터 (181), 사용자 장치 (182) 및 생산 회사 (183)와 같은 외부 장치들과 연결된다.  


그림 2. 낙수계수법 기법의 시스템


 그림 3은 시계열 정보 (400)로부터 새로운 스트레스 값 (440)을 수신한 것에 대한 상태 변수 (410)의 변화를 보여준다. 상태 변수 (410)은 이전 값 (411), 추세 (412), 굴절 스택 (413) 및 사이클 카운트 (414)로 구성된다. 이전 값 (411)은 시계열 정보 (400)의 가장 최근 값 (421)이며, 그림 3에서는 5이다. 추세 (412)는 시계열 정보 (400)에서 가장 최근 추세 (422)를 반영하며 그림 3에서는 증가하고 있음을 보여준다. 굴절 스택 (413)은 시계열 정보 (400)에서 진행중인 스트레스 사이클의 굴절 값 (422)에 해당하는 상단 값을 포함하며 그림 3에서는 1이다. 굴절 스택 (413)은 진행중인 스트레스 사이클의 기본 값 (424)에서 상위 값에서 두 번째 값을 더 포함한다. 그림 3에서는 6이다. 사이클 카운트 (414)은 다른 사이클 크기에 따른 복수의 카운터를 포함한다. 스트레스 사이클의 크기는 스트레스 주기의 기본 값 (424)과 굴절 값의 차이이다. 새로운 스트레스 값 (440)은 진행 중인 스트레스 주기의 기본 값 (424)와 일치하는 6이다. 상태 변수 (410)는 다음과 같은 세 번의 변화를 겪는다. 첫 번째 단계에서 굴절 스택 (413)은 이 스택에서 상위 2개를 나타내는 값으로 업데이트한다. 다음 (두 번째) 단계에서 사이클 카운트 (414)는 스트레스 사이클 (442)을 반영하여 업데이트한다. 마지막 단계에서 이전 값 (411)이 새 스트레스 값 (440)을 기반으로 업데이트된다.   


그림 3. 수신한 스트레스 값에 대한 상태 변수


 그림 4는 스트레스 주기를 모니터링하는 방법 (500)을 보여주는 다이어그램이다. 단계 (510)에서 스트레스 수치의 현재 값이 수신된다. 예를 들어, 스트레스 수치는 센서로부터 수신될 수 있다. 현재 값은 다양한 스트레스 수치에서 얻어진 이전 값과 비교된다 (520). 단계 (530)에서 다수의 스트레스 수치의 변화가 감지된다. 변화가 감지되는 지점은 다수의 스트레스 값의 정점 또는 낮은 지점이다. 프로세스 (540)은 방법 (500)에서 스트레스 주기의 변하는 값과 기본 값을 업데이트 하기 위해 진행한다. 현재 값과 기본 값을 비교하기 위해 프로세스 (550)을 진행된다. 이를 위해 단계 (550)에서 현재 값은 스트레스 사이클의 기본 값과 비교된다. 예를 들어, 기본 값은 데이터 스택 내 가장 높은 요소에서 두 번째 요소에 접근하여 결정한다. 단계 (560)에서 다수의 스트레스 수치의 현재 값과 기본 값의 차이를 통해 스트레스 사이클의 끝부분의 영역이 관측된다. 스트레스 주기는 프로세스 (560)에서 스트레스 사이클의 종료됨이 기록된다 (570).


그림 4. 스트레스 주기를 모니터링하는 방법


 테슬라는 차량을 출시한 후에 자체적으로 테스트하는 과정에서 메모리의 스트레스로 인해 문제가 발생함을 인지한 것으로 보인다. 테슬라는 이에 대한 해결책을 제시하기 위해 실험을 진행한 것으로 보인다. 실험에 대한 결과로부터 본 특허가 출원된 시점 (2019년 12월)으로 봐도 테슬라 모델S가 문제가 일으키기 전에 개선할 의향을 가지고 있음을 알 수 있다. 새로운 차량의 출시만이 중요한게 아니라 제품에서 문제가 발생할만한 요소들을 재검토해보면서 문제 발생 시 빠르게 대처하는 것도 고객을 떠나지 않게 하는 중요한 요소인 것으로 사료된다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호15 / 934 , 899
출원일자2018.03.23
출원인DeepScale , Inc.
등록번호(일자)US 2018 / 0275658 A1(2018.09.27)
발명의 명칭

DATA SYNTHESIS FOR AUTONOMOUS CONTROL SYSTEMS


 자동차의 주행환경은 예상하지 못한 변수가 많고, 순간적으로 빠른 판단을 요구하는 상황이 발생하기도 한다. 이로 인해 인지 기술을 통해 수집한 정보를 빠르고 정확하게 판단하는지가 중요한 요소 중 하나이다. 또한, 방대한 정보와 정확한 판단이 선행되었지만, 상황에 적합하게 제대로 구현하지 못한다면 소용이 없게 된다. 인지와 판단과정을 이용하여 의도한대로 차량을 제어하는 기술은 자율주행을 완성하는 최종 기술이라고 할 수 있다 (그림 1).   


그림 1. 인지와 판단을 통한 제어를 진행하는 과정


  각종 센서로부터 획득한 정보를 바탕으로 주행을 시작한다고 할 때, 경로 안에 보행자나 장애물이 있다면 피해갈 것인지, 지나갈 것인지, 안전하거나 위험한 상황에 놓이게 되는 상황 등과 같은 수 많은 경우에서 최적의 방법을 선택해야만 한다 (그림 2).


그림 2. 자율주행 제어를 통한 최적의 방법 선택


 본 특허는 다양한 환경으로부터 획득한 센서 데이터를 이용하여 합성된 데이터를 생성하여 자율주행을 위한 차량제어 기술에 관한 내용이다.

  그림 3은 원래 환경 조건에서 센서 데이터에 다양한 환경을 생성하기 위해 아티팩트를 적용하여 합성 이미지를 생성한다. 합성된 센서 데이터를 사용하여 합성된 이미지에서 컴퓨터 모델을 훈련한다 (그림 4). 이에 대한 내용은 다음 문단에서 자세하게 설명하고자 한다. 그림 3에서 보는 바와 같이 본 특허에서는 길, 두 명의 보행자 및 길의 측면에 정지 표지판의 세 가지 환경으로 구성되어 있다. 마이크, 라이다 센서 및 카메라는 차량의 각 환경에서 이미지를 생성한다. 하나의 시뮬레이션 환경에 대해 ‘시뮬레이트 된 마이크1’, ‘시뮬레이트 된 라이다1’ 및 ‘시뮬레이트 된 카메라1’의 센서들에 의해 합성 데이터가 생성된다. 또 다른 시뮬레이션 환경에서 ‘시뮬레이트 된 마이크2’, ‘시뮬레이트 된 라이다2’ 및 ‘시뮬레이트 된 카메라2’에 각 센서들에 의해 합성된 데이터가 획득된다. 모델 훈련 시스템 (140)은 원하지 않는 인공물을 제거하는 원본과 합성된 훈련 데이터 쌍을 기반으로 자율주행 제어에 필수적인 차선 표시와 같은 물체를 구별하도록 컴퓨터 모델을 만든다.


그림 3. 시뮬레이션 된 환경의 합성 이미지 생성


 재구성 모듈 (315)는 특정 센서로부터 누락되거나 불완전한 센서 데이터를 수신한 다음, 다른 센서로부터 생성된 데이터로 보완하여 해당 센서에 대한 재구성된 센서 데이터를 출력하는 재구성된 모델을 훈련시키는 중요한 단계이다. 예를 들어, 라이다 센서의 신호는 비나 안개에 의해 완화되지만, 카메라와 라이다 센서의 신호는 직사광선에 의해 방해 받는다. 이러한 다양한 경우를 통해 이러한 시나리오가 센서 데이터의 일부가 불완전하게 되거나 누락됨을 확인할 수 있다. 재구성 모듈 (315)는 하나 이상의 센서로부터 획득한 센서 데이터에서 누락된 부분을 다른 센서에서 제공하는 정보를 이용하여 하나 이상의 복원하는 신경망 모델을 훈련시킨다. 여기서 신경망 모델은 합성곱 신경망, deep neural networks (DNN), 순환 신경망 및 자기조직화 맵을 훈련 데이터 세트에 이용하여 학습한다.


그림 4. 재구성 모델의 훈련 과정


그림 5. 자율주행 제어를 위한 네트워크 환경


 자율주행의 마지막 단계는 인식과 판단하는 대로 차량을 움직이게 만드는 제어 기술이다. 자율주행 시스템의 제어 기술은 다른 영역과 실시간으로 통신하면서 차량 속도 조절, 조향, 제동 등에 대해 탑승자를 위해 조절한다. 본 특허는 이 기술들 중 외부 환경의 조건에서 자율주행을 위한 기술이다. 특히, 일부 다른 환경 조건에서 마이크, 라이다 센서 및 카메라는 서로 상호보완해주며 영상을 복원하여 안전하게 자율주행을 제어할 수 있도록 해준다. 이러한 기술이 추후에 더 다양한 환경에 적용될 수 있다면 더욱 신뢰할만한 자율주행기술을 제공할 수 있을 것이다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호10-2013-0101288
출원일자2013.08.26
출원인한화테크윈 주식회사
등록번호(일자)10-2083926(2020.02.26)
발명의 명칭영상 융합 시스템 및 그 방법


 야간투시경에 사용되는 감시 카메라 시장은 연평균 성장률이 16.6%의 매출을 기록해오고 있고, 글로벌 시장 규모는 6억 9,760만 달러 (2020년)에서 12억 8400만 달러 (2025년)로 증가할 것으로 예측된다. 군용 투시경을 생산할 수 있는 나라는 5개국 (미국, 러시아, 독일, 영국, 일본)에 불과하다. 한국이 이러한 나라들에 합류 할 가능성이 높아지고 있다. 국내에서 군용 야간투시경이 이미 생산되고 있지만, 핵심 부품은 수입에 의존하고 있다. 군 당국과 방위산업관련 회사들은 투시경의 영상증폭 제조기술을 제조할 수 있는 기술을 이전 받아 투시경 완제품을 국산화하는 것을 목표로 하고 있다.

 야간투시경은 현대전에서 승패를 결정짓는 핵심 장비 중 하나이기 때문에 타국에서 야간투시경 완제품이나 핵심부품을 수출이 엄격히 금지하는 이유다. 이로 인해 한국은 유럽의 투시경 업체들의 핵심부품을 수입해 완제품을 생산해왔지만, 2019년에 흐름이 변하였고 기술이전이 가능해졌다. 한국 내 기업이 유럽회사로부터 영상증폭관에 대한 기술이전을 받게 되면, 자체기술로 야간투시경 완제품을 생산할 수 있다.   

  본 특허는 야간 투시경의 가시광 카메라와 열상 카메라로부터 획득한 영상을 융합함으로써 두영상의 각각의 장점을 모아 하나의 영상으로 만드는 기법에 관한 내용이다. 그림 1은 본 특허의 영상 융합 기술을 개략적으로 도시한 플로우 차트이다. 제 1영상센서 (10) 및 제 2영상센서 (20)은 동일 장면을 촬영하여 각기 다른 영상 정보를 제공하는 서로 다른 특성의 카메라이다. 제 1영상센서 (10)는 가시광 카메라를 사용하여 빛을 검출하는 방식으로 영상 정보를 획득한다. 제 2영상센서 (20)은 적외광 카메라를 이용하여 물체가 발산하는 열에너지를 감지하여 적외선 파장을 검출한다 (그림 2). 영상 정합부 (30)은 각 카메라로부터 획득한 두 개의 동일한 장면을 위치 관계를 대응시켜 하나의 좌표계로 정렬시키는 영상 정합을 수행한다. 영상 융합부 (40)는 가시광 카메라와 적외광 카메라의 상호 장단점을 적절하게 이용하여 물체의 영상을 표시함과 동시에 그 물체의 열적 분포 상태를 명확하게 나타냄으로써 최적의 정보를 융합 영상에 표현한다. 이 과정에서 가시 영상과 적외광 영상의 각 국소 영역마다 융합 영역 가중치를 각각 조절함으로써 융합 영상의 픽셀 값이 변경된다 (그림 4). 사용자는 사용자 입력부 (60) 내 디스플레이부 (50)에 표시된 융합 영상에서 UI 또는 GUI를 포함하는 OSD (On Screen Display) 메뉴를 이용하여 적합한 영역과 가중치를 지정한다 (그림 5).  


그림 1. 영상 융합 기술을 도시한 블록도


   

(a) 가시광선 영상                  (b) 적외광 영상

그림 2. 가시광선 영상과 적외광 영상의 차이


그림 3. 가중치를 결정하기 위한 영역 분할


그림 4. 국소 영역별 가중치를 이용하여 융합한 결과 영상


도 5. 사용자 지정 방법을 설명하는 도면


 한국의 그 동안 영상증폭관에 대한 기술이 없었으므로 수입을 통해 야간투시경 완제품을 제작하였다. 하지만 2019년부터 유럽의 기업으로부터 영상증폭관에 대한 기술 이전을 제공받음으로써 자체적으로 완제품을 생산할 수 있게 되었다. 국산에서 생산된 야간투시경에 정부와 기업의 투자를 통한 다양한 알고리즘을 개발하여 적용하고 테스트를 해봄으로써 타국의 제품보다 우수한 성능을 나타내어 역수출 할 수 있는 날이 오기를 기대해본다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호10-2019-7032170
출원일자2018.04.11
출원인테슬라, 인크.
등록번호(일자)10-2019-0133751(2019.12.03)
발명의 명칭구조(構造) 케이블


 자동차는 소재 기술의 발전과 IT 기술의 접목으로 기계공학, 전자공학, 신소재공학 등 다양한 분야가 융합된 장치가 되어가고 있다. 환경과 안전을 획기적으로 혁신한 새로운 기술이 적용된 차량들이 출시되고 있다. 차량에 적용되는 전선의 길이는 차량 1대당 대략적으로 평균 1.5km가 사용되며, 커넥터는 차량의 종류에 따라 400개에서 700개 정도가 사용된다. 전선과 커넥터의 양적인 증가를 억제하기 위해 전장품을 하나로 묶거나 통신망을 사용하고 있지만, 전장품의 증가는 전선량과 커넥터의 수가 증가함을 의미한다.

 컴포넌트 케이블, USB 케이블 등과 같은 전통적인 케이블들은 상이한 구조물들에 배치되는 적절한 커넥터와의 연결을 위해 사람의 손으로 다루기가 용이하지만 자동화하기는 어렵다 (그림 1). 또한, 제조 시 기존의 가요성 (flexible) 케이블을 라우팅하는 것은 자동화할 수 없으므로 사람이 손으로 직접 작업해야만 한다. 이러한 수동 작업은 시간이 오래 걸리고 비용이 많이 든다.


그림 1. 차량 수동 조립


 본 특허는 앞 단락에서 언급된 결점들을 극복하기 위한 구조 케이블에 대한 내용이다.

그림 2는 몸체에 내장된 구조적 요소에 나란히 위치한 다수 와이어를 가지는 몸체를 도시하는 구조 케이블의 단면도이다. 구조 케이블 (100)은 6개의 동일 선상 와이어 또는 전도체 (102a 내지 102f)를 가진다. 6개의 와이어/전도체보다 적거나 많을 수도 있고, 동일 선상에 위치할 필요는 없다. 구조 케이블 (100)의 와이어 (102a 내지 102f)는 전력 전송 또는 데이터 전송에 이용되도록 와이어/전도체가 포함된다. 와이어/전도체 (102)는 동일 선상의 구성으로 배열된다. 구조 케이블에 커넥터 추가 시 자동화를 촉진하기 위해 와이어/전도체는 설정된 기하학적 구조로 배열한다. 6개의 와이어/전도체는 동일선상에 위치하고 있고 각 쌍 사이의 거리 d만큼 인접한 구조를 가진다. 구조적 요소 (104)는 구조적 지지를 제공하며 다른 기하학적 구조로의 조작을 허용한다. 이를 위해 일정한 두께의 철, 강철, 스테인리스, 알루미늄, 구리, 주석 또는 니켈이 금속 바로 사용될 수 있다. 몸체 (110)는 비전도성 소재로 제조되며, 유전체 (폴리비닐리덴 플루오라이드, 폴리우레탄, 에틸렌 프로필렌 고무 등)가 사용될 수 있다. 또한, 몸체 (110)의 두께는 0.1mm 내지 10cm의 범위를 가진다.


그림 2. 구조 테이블의 단면도


 그림 3은 구조 케이블을 제조하는 압출 공정을 보여준다. 구조 케이블은 원료 (304)로부터 몰드 (320)를 이용하여 압출된다. 원료 (304)는 압출기 (300) 내 호퍼 (306)에 공급된다. 압출기 (300)는 모터 (310)에 의해 회전하는 스크류로드 (308)을 통해 원료 (304)를 압출기 (300)의 케이싱 (314)과 스크류로드 (308) 사이에 위치한 환형 챔버 (312)에서 혼합함으로써 원료 (304)를 균질화한다. 균질화된 원료 (304)는 환형 챔버 (312) 주위에 배치된 하나 이상의 히터 (316)로부터 가열된다. 가열 시, 균질화된 원료 (304)는 액체가 되고 흘러서 압출물 (302)을 생성한다. 압출물 (302)은 노즐 (318)로부터 배출되고 스크류로드 (308)에 의해 가해지는 압력하에 몰드 (320)로 흐른다. 몰드 (320)를 개폐하기 위해 상기 2개의 부분 (322, 324)을 이용한다. 몰드 (320)의 상기 2개의 부분 (322, 324) 이용 시 서로 폐쇄될 수 있다. 배출구 (326)는 회전을 통해 구조 케이블 (100)의 굽힘을 용이하게 만든다. 굽힘을 용이하게 만드는 것은 와이어 간 거리를 유지함을 의미한다. 여기서 와이어 간 거리의 유지함은 전기적 특성을 보존하기 위해 필요하다.



그림 3. 구조 케이블을 제조하는 압출 공정


 그림 4는 자동차 내 센서를 연결하기 위한 구조화된 케이블을 도시한다. 커넥터 (502, 504)를 포함하는 구조화된 케이블 (400)은 자동차 (700)에서 센서 (702, 704)를 GPU/CPU (706)에 연결한다. 센서들을 서로 연결하고 GPU/CPU (706)에 연결하여 커넥트를 가지는 구조화된 케이블을 이용하여 센서는 GPU 및 CPU에 연결된다. 여기서 센서는 광학 또는 적외선 카메라, 라이다, 초음파 센서 등으로 사용될 수 있다. 엔드 커넥트가 있는 구조 케이블은 보다 정밀하게 라우팅을 해야하므로 위치들 사이보다 짧은 케이블을 이용하여 신호 대 잡음비의 성능을 향상시킬 수 있다. 또한, 구조적 강성은 설치 시간을 감소시켜주며 자동화를 증가시킨다.


그림 4. 자동차 내 센서를 연결하기 위한 구조화된 케이블


 테슬라에서 제안하는 구조 케이블은 원하는 위치에 신뢰할 수 있는 데이터 연결을 제공함과 동시에 로봇 팔 (자동화 프로세스)에 의해 제자리로 조작될 수 있는 구조적 무결성을 가지는 케이블이다. 이는 케이블과 커넥터에 관련된 다수의 인력들이 자동화가 되어감에 따라 실직상황에 놓이게 되지만, 회사의 입장에서는 자동화를 통해 인건비 감축과 생산 효율을 높일 수 있다. 즉, 인간의 노동력이 필요한 분야가 점차 줄어들고, 필요성조차 없는 분야가 생겨나고 있다. 이에 대해 테슬라의 일론 머스크는 “디지털 시대에 적합한 자동화를 활용한 기술, 공정 및 프로세스에 대한 요구가 점차 증가함에 따라 새로운 일자리를 창출된다.”라고 언급하였다. 일론 머스크는 이러한 일자리의 변화가 구직자에게 새로운 기회가 될 수 있을 것으로 보았다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호15/253,221
출원일자2016.08.31
출원인Tesla Moters, Inc.
등록번호(일자)US 10,393,864 B2(2019.08.27)
발명의 명칭HIDDEN ULTRASONIC SENSOR ASSEMBLY


 “자동차 다섯 대 중 한 대는 주차장에서 발생”한다는 기사가 있다. 주차장에서 차량의 속도는 매우 느린 속도이고 카메라와 같은 장치가 있음에도 불구하고 근거리에 위치한 주변환경을 완전히 인지하지 못하므로 발생한다.

 주행은 주차 위치에서 시작하여 주차 기동으로 끝나기 때문에 자율주행차량은 근거리 환경을 안정적으로 인식하는 것이 중요하다. 센서 기술들 (카메라, 라이다 등)은 대부분 거리에 초점을 두고 있지만 자동차 주변으로부터 0~5m거리의 환경에 대한 인식이 부족하다. 초음파 센서는 박쥐와 같이 주변 환경을 실시간으로 인식하기 위한 원리를 이용하여 0~5미터까지의 근접환경에 중점을 둔 자율주행 및 자율주차에 목적을 두고 사용되어 오고 있다.   


그림 1. 초음파 센서를 이용한 근접환경 인식


  본 특허는 외부의 근접한 물체나 장소들을 인식할 수 없음으로 인해 발생하는 문제점을 해결하기 위해 차량 표면에 각기 다른 방향의 25개의 초음파 센서들을 설치하여 인식하는 시스템 및 기술에 대한 내용이다.

 그림 2는 패널 내부 (200) 에 장착된 초음파 센서의 단면적인 부분을 보여준다. 패널 내부 (200)은 외부 표면 (200A)와 내부 표면 (200B)를 포함하는 바디 패널로 구성되어 있다. 센서 (108)은 기계 부품을 덮는 덮개 안에 장착되어 있으며, 물체 탐색하기 위한 신호로서 사용되는 초음파 파장을 생성하기 위해 환경을 설정한다. 센서 (108)는 충격완화재 (204) 내에 구축된 시작 부분 (404)를 통해 진동을 내부 표면 (200B)으로 보낸다. 충격완화재 (204)는 초음파의 주파수에 패널 진동을 완화시키며 -40도에서 90도까지의 온도 범위에서 견딜 수 있다. 물질 (208)과 결합 성분 (206)은 하나 이상의 필터 (212)을 포함하는 매트릭스 (210)에서 도식적으로 볼 수 있다. 이 물질 (208)은 정해진 온도의 범위와 습한 환경에서 견딜 수 있으므로 사용된다. 


그림 2. 초음파 센서의 부분적인 단면


그림 3은 음향 방식 (408)의 충격완화재 (204)로부터 센서를 개방 (404)하기 위한 구조 (400)를 보여준다. 충격완화재 (204)의 일부의 모습은 매우 간단하다 (그림 2). 결합 성분 (206)은 초음파 센서 개방 영역 (404) 내에 존재하며, 영역의 면적 (410)은 결합 성분 (206)와 음향 방식 (408) 사이의 크기이다. 이 크기의 차이는 센서를 설치하기 위한 공간으로 사용하기 위한 영역이다. 그림 2의 센서 (108)은 외부와 내부에서 방열하면 내부의 방열은 일부 구조에 의해 되돌아온다. 남아있는 음향 파장들은 다시 되돌아 올 것이며 센서 장비에 의해 신호 (원신호 또는 잡음)가 확인된다. 남아있는 음향 파장들이 획득될 때 센서 장비에서는 잡음이 얻어진다. 잡음을 감소시키기 위해 음향 방식 (408)은 음향 파장들을 감소시키거나 흡수한다.


그림 3. 센서의 잡음을 방지할 수 있는 방법


 그림 4는 차량 (620) 내 숨겨진 초음파 센서 (600)를 보여준다. 지붕에 설치된 초음파 센서 (600)는 숨겨진 초음파 센서들과 같은 하나 이상의 다른 센서들과 함께 작동한다. 예를 들어, 하나 이상의 센서들은 차량의 프론트 엔드 (608)와 후미 (610)에 설치되어 있다. 차량문에 설치된 초음파 센서 (604)는 차량 후방의 문에 설치되어 있다. 차량의 하부 도어 부분에 설치된 센서는 차량문의 낮은 부분이 닫히는 것을 포착하는 반면 상부 도어 부분은 차량문이 닫힐 때 차량의 지붕의 일부가 작동하여 포착한다.


그림 4. 차량 내 숨겨지게 설치된 초음파 센서들


 테슬라 모터스의 본 특허는 차량에 설치된 기존의 초음파 센서를 이용한 기술이 낮은 인식 성능을 나타내었으므로 충격완화재, 음향 방식 및 초음파 센서들의 협업 등을 통한 인식 성능을 향상시키기 위한 방법들을 제안하였다. 이로 인해, 근거리 (0m에서 5m까지)에서 주변 환경을 인식 할 수 있는 방안들을 제시하였고, 이 기술들은 추후에 자율주행과 자율주차를 위해 사용될 것으로 예상된다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호10/735,474
출원일자2003.12.12
출원인Washington University
등록번호(일자)US 7,120,486 B2(2006.10.10)
발명의 명칭BRAIN COMPUTER INTERFACE


 우리가 생각하고 행동하는 것은 뇌가 내린 명령의 결과이다. 뇌가 신체에 명령을 내려 움직이듯이 뇌의 신호를 이용해 기계나 전자 기기 등과 같은 장치들에 명령을 내릴 수는 없는 것일까? 상상 속에서만 가능할 것 같았던 이 기술은 ‘뇌-컴퓨터 인터페이스’라고 불리며, 점차 구현되고 있다 (그림 1). 예를 들어, 뇌-컴퓨터 인터페이스는 게임을 할 때 키보드 등을 통해 기기를 조작하는 것처럼 뇌의 신호만을 이용해 기기를 작동시키는 것이다.


그림 1. 뇌-컴퓨터 인터페이스를 이용한 장치 이용


 뇌에서 일어나는 신호를 기기에 전달하여 사용자의 의도대로 움직이기 위해 가장 필요한 기술은 생각을 읽어내는 기술이다. 생각은 동시다발적으로 발생하기 때문에 정확하게 파악하기는 쉽지 않다. 테슬라는 사람의 생각을 명확하게 파악하기 위한 실험을 수행한 뒤, 실험 결과를 통해 2006년도에 본 특허를 출원하였다.

  특허가 발표되었을 당시 그림 2은 활성화 상태와 비활성화 상태에서 사람을 위한 표준적인 스펙트럼 분석 방법이 사용되었다. 이 그림으로부터 인식할 수 있는 범위는 EEG와 ECoG로 표시되며, 활성화 상태와 비활성화 상태에서 진폭의 크기는 다르게 나타났다. 예를 들어, 반작용 주파수들의 범위는 EEG 시스템에서 40-50Hz를 나타내었지만, ECoG 신호의 신호 대 잡음비 (signal-to-noise ratio)는 두개골에 의해 감소하기보다는 증가하였음을 나타냈다.


그림 2. 표준적인 스펙트럼 분석 방법


  이러한 기존의 연구를 기반으로 테슬라는 ECoG 기반 뇌-컴퓨터 인터페이스 기법을 제안하였다 (그림 3). 이 기술의 ECoG 신호는 뇌의 신호로부터 획득되며, 뇌의 신호의 활성화 여부는 사용자의 의도로 해석한다. ECoG 신호는 경막하 (subdural) 또는 경질막바깥 (epidural)을 통해 전극 배열 (electrode array)을 이용하여 획득할 수 있다 (그림 4). 신호의 변동을 보여주기 위해 ECoG 신호는 증폭기 (Amplifier)와 대역 통과 필터 (Band Pass Filter)를 통해 전달된다. 이 과정에서 아날로그 신호는 디지털 신호로 변환된다 (그림 5). 다음으로 특징 추출 (feature extraction), 번역 알고리즘 (translational algorithm) 및 장치 명령 (device commands)으로 구성된 프로그램을 실행하기 위해 신호 처리 (signal processing)로 전송된다. 앞의 과정을 거친 실험자의 ECoG 신호 결과를 보여주고자 컨트롤러 화면 (controller screen)에 전달된다 (그림 6).


그림 3. 뇌-컴퓨터 인터페이스의 흐름도


그림 4. 지정된 전극 위치로부터 획득한 신호 분석


그림 5. ECoG 기반 뇌-컴퓨터 인터페이스 시스템


그림 6. 제안한 기법의 그래픽 표현


 국내외에서 선천적인 이유 또는 후천적 외상 등의 이유로 신체를 자유롭게 움직이는데 어려움을 겪는 사람들이 있다. 이 기술은 사람들의 불편함을 해소할 수 있을 뿐만 아니라 원활한 의사소통을 도울 수 있다. 뇌-컴퓨터 인터페이스 기술이 더 보편화되면 스마트폰이 일상 생활에 일부가 된 것과 같이 인간의 삶에 큰 변화를 가지고 올 수 있을 것으로 보인다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호10-2020-7021561
출원일자2018.12.12
출원인테슬라, 인크.
등록번호(일자)10-2020-0100812(2020.08.26)
발명의 명칭하드웨어 기반 풀링을 위한 시스템 및 방법


 합성곱 신경망 (Convolutional Neural Network, CNN)을 알려면 우선 사람에 존재하는 뉴런에 대해 이해해야만 한다. 시각 피질 안의 수 많은 작은 국부 수용영역을 가지며, 이러한 뉴런들은 시야의 일부 범위 안에 있는 시각 자극에만 반응한다. 연구자들은 뉴런 중 큰 수용영역을 가져 외곽선과 같은 저수준의 패턴이 조합되어 텍스쳐/물체 등과 같은 복잡한 패턴에 반응하는 것을 알게 되었다. 실험 결과로부터 연구자들은 고수준의 뉴런이 이웃한 저수준의 뉴런으로부터 출력한다는 아이디어를 도출하였다. 이 아이디어가 CNN으로 점차 진화했으며, 1998년 얀 리쿤 (Yann Lecn)의 논문에서 손글씨 숫자를 인식하는데 소개되었다.

 CNN의 구조는 합성곱층과 풀링층으로 구성되어 있다 (그림 1). 풀링층은 합성곱층 이후에 배치되는 독립 빌딩 블록이다. 이미지에 적용될 때, 풀링층은 네트워크가 특징 맵을 결정하고, 이미지에 대한 특징들의 세트를 학습할 수 있게 한다. 또한, 네트워크를 통해 층 (layer)으로부터 다음 층 (layer)으로 진행 시 뉴런의 수를 감소시킴으로써 연산량을 감소시키는 역할을 한다.


그림 1. CNN의 구조


 본 특허에서는 하드웨어에서 이용 가능한 계산 자원의 최종 이용 성능을 증가시킬 수 있도록 뉴럴 네트워크 내 풀링 계층의 성능을 개선하는 방법을 제안하였다. 그림 2는 본 특허에서 제안하는 풀링 유닛 아키텍쳐 (pooling unit architecture)의 블록도이다. 풀링 유닛 아키텍쳐 (200)은 입력 (202)와 동일한 폭을 가지는 복수의 행들로 입력 (202)을 배열하고, 저장한다. 여기서 행 정렬기 (206)는 입력 (202)를 동일한 폭을 갖는 복수의 행들로 변환시킨다. 풀러 (210)은 풀링 어레이 (208)에 액세스하여 풀링 어레이 (208)의 임의의 서브섹션 (subsection)을 처리할 수 있다. 풀링 어레이 (208) 내 임의의 서브섹션은 복수의 풀링될 값을 포함하고 있다. 예를 들면, 풀러 (210)는 평균 풀링 값을 생성하기 위해 3x3 크기의 풀링 윈도우 (pooling window)에 대응하는 9개의 풀링을 처리할 수 있을 뿐만 아니라 풀링 윈도우 내 파라미터 설정에 따라 크기 및 형태를 적합하게 만들 수 있다. 마지막으로 한 번에 하나의 행과 같이 사이클마다 풀링 결과들 (230)을 생성하기 위해 데이터 행들을 정렬하기 위한 방법을 사용한다. 이를 통해 n개의 산술 사이클들이 기간에 걸쳐 재포맷된다 (그림 3).


그림 2. 풀링 유닛 아키텍쳐의 블록도


그림 3. 풀링 연산들을 수행하기 위한 프로세스


  기존 연구들에서는 가중치들을 공유하여 콘볼루션 계층들의 성능을 개선시키고, 산술 로직 유닛 (arithmetic logic unit utilization)만을 개선하는데 발전을 시켜오고 있었다. 이에 반해, 계산 집약적인 풀링 계층들은 뉴럴 네트워크 아키텍처들에 내재된 제약들에 의해 무시되었다. 전체 연산량을 감소시키기 위해 테슬라는 뉴럴 네트워크 아키텍처들에 내재된 제약들에 의해 무시되어오고 있었던 풀링 계층의 성능을 개선하여 계산 자원의 성능을 증가시킬 수 있도록 하였다. 목적에 적합한 딥 러닝 모델을 학습시키기 위해 양질의 데이터와 높은 연산량이 요구되는 시점에서 연산량을 효율적으로 사용하는 본 특허의 기술이 다양한 분야에 어떤 방법으로 적용될지 기대된다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호10-2020-7017954
출원일자2018.11.20
출원인아마존 테크놀로지스, 인크.
등록번호(일자)10-2020-0087853(2020.07.21)
발명의 명칭네트워크 액세스 가능한 머신 러닝 모델 훈련 및 호스팅 시스템


 프로세스 성능에 대해 언급할 때, 무어의 법칙이 통하던 시절이 있었다. 현재도 여전히 유효한 이야기지만 예전처럼 모든 혁신을 상징하는 기준은 아니다 (그림 1). 2020년 프로세서 성능은 다양한 측면에서 보여지고 있다. 더 크고 복잡한 연산을 처리하는데 있어 클럭 외의 것들이 고려되고 있다. ‘어떤 것을 더 중요하게 보느냐? 혹은 어떤 도메인에 적용할 것인가?’가 중요한 고려 요소가 되었다. 예를 들어, 인공 지능과 데이터 과학은 병렬 처리가 성능 평가의 주요한 지표가 되었다.


그림 1. 트랜지스터 집적수의 성장과 무어의 법칙


 최근 시장에서 주목 받는 것이 구글의 TPU (Tensor Processing Unit)이다. 구글의 TPU를 사용하는 기업이 빠르게 늘어나고 있다. 구글이 제공하는 번역, 사진 및 검색 등 AI 기능이 요구되는 서비스를 처리하는 인프라가 TPU이다. 현재는 수 많은 기업들이 머신 러닝과 관련하여 트레이닝 또는 예측 등의 분야에서 활용하고자 TPU를 사용한다.

 이러한 변화에 맞추어 아마존은 네트워크 액세스가 가능한 머신 러닝 서비스를 특허로 출원하였다. 그림 3의 모델 훈련 시스템은 머신 러닝 모델 훈련 루틴 (700)을 위한 흐름도는 그림 2와 같다. 머신 러닝 모델 훈련 루틴 (700)은 블록 (702)에서 시작한다. 단계 (704)에서 컨테이너 이미지 위치 및 훈련 데이터 위치가 수신된다. 다음 단계 (706)에서는 가상 머신 인스턴스가 초기화된다. 초기화된 가상 머신 인스턴스는 머신 러닝 모델 훈련을 수행할 인스턴스이다. 컨테이너 이미지 및 훈련 데이터가 단계 (708)에서 호출된다. 여기서 컨테이너 이미지는 컨테이너 데이터 저장소 (170)에서 불러들여지며, 훈련 데이터는 훈련 데이터 저장소 (160)에서 부른다 (그림 4). 머신 러닝 컨테이너가 가상 머신 인스턴스에서 초기화된다 (710). 이 단계에서 머신 러닝 컨테이너가 수신된 컨테이너 이미지를 데이터로 사용하도록 구성된다. 다음 단계 (712)에서는 머신 러닝 기반 훈련 컨테이너에 저장된 코드는 불러온 훈련 데이터를 사용하여 실행한다. 코드를 훈련 데이터로 적용하여 획득한 실행 결과로부터 생성된 모델 데이터가 저장된다 (714). 그 후, 모델 데이터는 훈련 모델 데이터 저장소 (175)에 저장된다 (그림 4). 단계 (716)은 머신 러닝 모델 훈련 프로세스를 진행하는 동안 새로운 컨테이너 이미지가 수신되는지 확인한다. 새로운 컨테이너 이미지가 수신되는 경우 머신 러닝 모델 훈련 루틴 (700)은 블록 (718)로 진행되며, 새로운 컨테이너 이미지가 수신되지 않는 경우 머신 러닝 모델 훈련 루틴 (700)은 블록 (720)으로 진행하여 종료된다.


그림 2. 아마존이 개발한 기술의 블록도


그림 3. 모델 훈련 시스템


그림 4. 운영 환경의 블록도


 GPU는 머신 러닝을 학습시키기 위한 전용 인프라로 널리 사용되어 오고 있다. GPU를 이용하여 머신 러닝을 위한 환경을 구축하기 위해서는 높은 비용이 들어간다. 이에 반해, TPU는 클라우드가 갖는 경제성의 이점을 살릴 수 있고, 필요한 성능을 필요할 때만 원하는 만큼 사용할 수 있다. 이는 머신 러닝을 이용한 프로젝트의 생산성과 효율성을 높일 수 있다. 이러한 변화의 흐름에 맞추어 아마존은 고객에게 최적의 서비스를 제공하기 위한 기술을 구축한 것으로 보인다. 


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

2021-01-13
출원번호10-2020-7017612
출원일자2018.12.11
출원인테슬라, 인크.
등록번호(일자)10-2020-0089302(2020.07.24)
발명의 명칭매트릭스 프로세서를 위해 매트릭스 입력을 벡터화된 입력으로 변환하기 위한 시스템 및 방법


 머신 러닝 학습을 위한 하드웨어는 우리가 사용하는 일반적인 하드웨어와 여러 개의 코어로 설계되며, 낮은 정확도의 연산, 새로운 데이터 처리 구조 및 인-메모리 컴퓨팅 (in-memory computing) 능력에 초점을 맞춘다. 첫 번째, 머신 러닝 학습을 위한 기본적인 아이디어는 대량으로 처리할 수 있도록 병렬화하여 연산을 수행할 수 있다 (그림 1). 예를 들어, GPU는 병렬적인 계산 작업에 그래픽 카드를 사용해서 CPU 성능의 10배까지 향상시킬 수 있다. 두 번째는 멀티코어 구현이다 (그림 2). GPU는 보통 픽셀을 스크린에 보내는데 여러 개의 단순한 코어를 가속화하도록 사용한다. 코어들의 숫자가 너무 많아지면, 전통적인 연산 방식으로는 할 수 없는 단순한 산술 연산을 위해 사용된다. 앞에서 언급한 일반적인 시스템들은 대량의 데이터를 처리하고, 복잡한 수학적 연산을 처리하기 위해 사용되므로 계산 자원/속도는 기존의 일반적인 하드웨어 설계의 능력으로 제한된다.


그림 1. IBM의 대규모 병렬 슈퍼컴퓨터


그림 2. 4개의 코어가 탑재되어 있는 CPU 회로


 본 특허는 고성능 매트릭스 프로세서를 위해 M x N 데이터 매트릭스를 벡터화된 입력으로 변환에 대한 내용으로 복잡한 수학적 연산들이 2차원 및 3차원 매트릭스들에서 수행될 수 있도록 M x N 매트릭스를 매트릭스 프로세스에서 정렬된 1차원 벡터로 매칭하기 위한 시스템에 대한 내용이다.

 그림 3은 콘볼루션들을 곱셈 회로에 매핑하기 위한 데이터 포맷터를 이용하는 매트릭스 곱셈 시스템에 대한 흐름도이다. 매트릭스 곱셈 시스템 (300)은 메모리 디바이스 (302), 데이터 포맷터 (306), 제어 로직 (308), 캐시 (312), 로직 회로 (314), 매트릭스 프로세서 (316) 및 시퀀서 (310)으로 구성되어 있다. 메모리 디바이스 (302)는 임의의 메모리 디바이스이고, 오디오/센서/초음파 데이터와 같은 임의의 데이터 타입의 데이터를 포함한다. 데이터 포맷터 (306)는 매트릭스 프로세서 (316)에 의해 효율적으로 처리될 수 있도록 벡터 포맷으로 데이터 입력 매트릭스를 변환한다. 제어 로직 (308)은 데이터 포맷터 (306) 또는 시퀀서 (310)에 자동으로 기능을 수행할 수 있도록 내장되어 있다. 이 중 데이터 포맷터 (306)는 매트릭스 승산기 (316) 내 예상되는 위치들과 매칭할 수 있도록 데이터를 포맷할 수 있는 필터 파라미터들에 따라 메모리 (302) 위치들로부터 데이터를 선택할 수 있도록 한다. 캐시 (312)는 메모리 (302)로부터 데이터를 재액세스 (re-access) 및 재판독해야 하는 것을 방지하기 위해 콘볼루션에 의한 재사용하기 위한 데이터의 로컬 복사본을 저장하는데 사용된다. 로직 회로 (314)는 M개의 가중치 연산 대상과 N개의 이미지 데이터 연산 대상을 매트릭스 프로세서 (316)에 입력한다. 매트릭스 프로세서 (316)는 곱셈, 누산 (accumulation) 및 시프트 연산들 (shift operations)을 수행할 수 있는 서브-회로 회로들을 포함한다 (그림 4). 시퀀서 (310)는 제어 로직 (308)으로부터 임의의 수를 가지는 콘볼루션 파라미터들을 포함하는 콘볼루션 명령들을 수신한다.


그림 3. 데이터 포맷터를 이용하는 매트릭스 곱셈 시스템


그림 4. 콘볼루션들을 매트릭스 곱셉 회로에 매핑하기 위한 프로세스


  머신 러닝을 학습시키기 위해 복잡한 수학적 연산을 구현하는데 사용되는 일반적인 프로세서 및 시스템에 대한 속도 및 성능의 지속적인 증가가 요구되고 있다. 앞에서 언급한 바와 같이 일반적인 시스템은 대용량의 데이터를 처리하고 복잡한 수학적 연산을 수행하기 위해서는 성능이 제한된다. 테슬라는 머신 러닝을 빠르게 학습하기 위한 목적을 가지고 개선된 시스템을 제안하였고, 이는 기존의 기술들보다 더 높은 효율성을 구현할 수 있게 되었다.


특허법인ECM


변리사 김시우


swkim@ecmpatent.com


02-568-2670

Copyright © 2019 by ECM IP&LAW FIRM . All Rights Reserved.

ECM IP&LAW FIRM
3F, 13, Teheran-ro 70-gil,
Gangnam-gu, Seoul,

Republic of Korea