訂閱
糾錯
加入自媒體

蘋果最新專利忙著研究AI圖像合成,視覺靈敏度抑制算法精準獲取人眼疲勞度!

知情郎·眼|

侃透公司專利事兒

今天聊聊蘋果的新專利。

看看蘋果的工程師最近忙著解決哪些技術(shù)難點問題,尤其在AI領域,有啥新進展。

最近蘋果日子過的不大順當,新產(chǎn)品iPhone?14因為鄭州富士康疫情也延遲交貨了。

01蘋果近期在忙啥

蘋果最近忙著搞生產(chǎn)!

人家集中精力忙iPhone?14產(chǎn)線如何恢復,幫著友商處理鄭州富士康問題。

眾所周知,鄭州富士康園區(qū)是 iPhone 14 Pro 和 iPhone 14 Pro Max 的主要組裝工廠。

庫克老爺子對iPhone 14 Pro系列寄予厚望,希望新品上市發(fā)光發(fā)財,延續(xù)蘋果在高端機的統(tǒng)治力。

可吆喝了半天,幫蘋果組裝手機的富士康出了簍子。

這些天,鄭州富士康員工因疫情逃亡廠區(qū)的段子滿天飛,鄭州園區(qū)2萬人確診疫情的消息,嚇壞了當?shù)亍?/p>

這恐怖疫情嚇慫了園區(qū),當?shù)貑T工紛紛跑路!

網(wǎng)友調(diào)侃,疫情拖累了產(chǎn)能,郭臺銘也許現(xiàn)在焦慮的吃不下飯了!

要知道,鄭州園區(qū)是生產(chǎn)蘋果iPhone?14的主力部隊,國內(nèi)訂單大多數(shù)都由此地生產(chǎn),現(xiàn)在園區(qū)隔離的隔離,封禁的封禁,一屁股地方,工人吃喝拉撒睡都在一起,搞得疫情感染人數(shù)都難統(tǒng)計了,還咋開工。

更慘的是,庫克新品發(fā)布會剛吆喝半天蘋果14性能有多牛,然后就沒下文了。

現(xiàn)在園區(qū)產(chǎn)線雞飛蛋打,也不知道何時能復工。

沒辦法,蘋果再牛,也得為疫情讓道,得照顧大陸園區(qū)員工的情緒,也只有延后訂單生產(chǎn),支持富士康寬慰工人!

人家日前發(fā)了公告表示支持富士康抗疫,優(yōu)先保障員工健康。

這局勢,估計明年蘋果,富士康轉(zhuǎn)向印度越南的舉措會更激進,一向以穩(wěn)定、執(zhí)行力強的大陸園區(qū)都出簍子了,還不積極分拆供應鏈。

哎,制造業(yè)不容易啊,富士康的工人更不容易,為這5000薪水拼死拼活!

02蘋果最新公開專利在研究啥

聊完業(yè)務動態(tài),聊專利。

下面蘋果關(guān)于AI方面的最新八個公開專利,多數(shù)圍繞姿態(tài)識別、視頻音頻AI檢測還原、影像數(shù)據(jù)合成等領域。

最近,知情郎很關(guān)注AI技術(shù),所以就找各大科技公司這方面的專利!看看人家工程師忙著處理哪些AI技術(shù)難點!

序號標題標題 (英文)解決的技術(shù)問題公開號

1

使用多個傳感器的基于機器學習的姿勢識別

MACHINE-LEARNING BASED GESTURE RECOGNITION USING MULTIPLE SENSORS

針對現(xiàn)有基于慣性傳感器的人體運動姿態(tài)識別中涉及特征較多、常用姿態(tài)識別方法不全面、識別精度不足等問題,專利提供了手勢姿態(tài)識別及修正算法研究,通過特征提取與建庫、特征篩選、姿態(tài)識別與修正等過程進行手勢軌跡、姿態(tài)判定,提高識別準確率。

US20220351086A1

2

基于AI檢測或分類結(jié)果的變化的視聽壓縮

VARYING AUDIO VISUAL COMPRESSION BASED ON AI DETECTION OR CLASSIFICATION RESULTS

圖像壓縮是數(shù)據(jù)壓縮(Data Compression)的一種,因為圖像壓縮減少了編碼圖像所需的數(shù)據(jù)位,但同時又保留了圖像細節(jié);谏疃葘W習的圖像壓縮算法的先進技術(shù),包括多層感知器、卷積神經(jīng)網(wǎng)絡和生成對抗網(wǎng)絡已發(fā)展多年,該專利提供一種AI模型算法,可幫助構(gòu)建并精細化處理圖像和壓縮模型,也方便迅速鎖定目標圖像。

US20220353458A1

3

用于空間音頻再現(xiàn)的時域神經(jīng)網(wǎng)絡

Time domain neural networks for spatial audio reproduction

語音增強涉及將目標語音信號與干擾性背景區(qū)分開來。盡管近年來使用變異自動編碼器或生成對抗網(wǎng)絡(GANs)的生成方法已被越來越多地使用,但弊端也不少。該專利提供了一種新的技術(shù)方案來強化捕捉麥克風聲音并強化了多音道信號,讓過去的音頻效果還原度更高!

US11490218B1

4

利用反向網(wǎng)生成更真實的合成數(shù)據(jù)

Generating more realistic synthetic data with adversarial nets

為了修改合成數(shù)據(jù)使得鑒別網(wǎng)絡不能可靠地辨別細化的合成數(shù)據(jù)和真實數(shù)據(jù)之間的差別,可以在對抗設置中學習生成網(wǎng)絡。生成網(wǎng)絡和判別網(wǎng)絡可以一起工作,以學習如何以降低的計算成本產(chǎn)生更真實的合成數(shù)據(jù)。該專利提供了一種技術(shù)而方案,讓合成數(shù)據(jù)更加逼近真實,難以被鑒別。

US11475276B1

5

使用基于圖像捕獲條件選擇的先驗概率分布的計算機視覺

Computer vision

using a prior probability distribution selected based on an image capture condition

訓練機器學習(ML)模型并將其用于產(chǎn)生與計算機視覺任務相關(guān)聯(lián)的概率分布。ML模型使用與基于傳感器數(shù)據(jù)確定的特定圖像捕獲條件相關(guān)聯(lián)的先驗概率分布。因此,機器學習模型被給予圖像作為輸入以及特定圖像捕獲設備條件的先驗概率分布。使用先驗概率分布可以提高用于計算機視覺任務的ML學習模型的準確性,效率或有效性。

US11468275B1

6

在部分潮濕條件下檢測顯示器上的觸摸用戶界面

Detecting touch user interface on a display under partial wet conditions

當液體存在于顯示器上時,會導致接觸不靈。觸摸屏或帶有觸摸輸入組件的顯示器通常使用電容技術(shù),通過測量由觸摸輸入引起的靜電場的變化來檢測觸摸輸入或用戶輸入到觸摸屏的位置。在某些情況下,無論是否檢測到觸摸輸入,液體都會引起靜電場的變化。結(jié)果,液體降低了觸摸輸入組件準確檢測觸摸輸入位置的能力,并且在某些情況下,觸摸輸入組件根本無法檢測觸摸輸入。然而,本專利提供的技術(shù)方案可克服這些問題。

US11422689B1

7

用于圖像創(chuàng)建的分類

Classification for image creation

各種技術(shù)被用于生成圖像內(nèi)容。例如,一些技術(shù)使用生成性對抗性神經(jīng)網(wǎng)絡(GAN)來生成圖像內(nèi)容,以提供看起來像可信場景的內(nèi)容。但是,基于回歸的技術(shù)所生成的內(nèi)容還可能遭受邊緣處不希望的銳度缺乏、結(jié)構(gòu)中缺乏銳度或清晰度、或者以其他方式呈現(xiàn)模糊,從而降低內(nèi)容的真實性。專利提供了使用基于分類的機器學習來為圖像的缺失部分(例如,一些或全部)生成感知上可信的內(nèi)容的系統(tǒng)和方法。

US11423308B1

8

自主車輛運動控制的決策

Decision making for autonomous vehicle motion control

 一種用于車輛的行為規(guī)劃器使用樹搜索算法和從一個或多個機器學習模型獲得的試探法來生成車輛的多個條件動作序列。每個序列對應于車輛的預期狀態(tài)序列。至少一些動作序列被提供給車輛的運動選擇器。運動選擇器基于接收到的條件動作序列和從車輛的一個或多個傳感器接收到的數(shù)據(jù)來生成運動控制指令,并將指令發(fā)送到車輛的控制子系統(tǒng)。

US11403526B2

03檢測眨眼提高視覺舒適度方案

上面的專利其實具體解讀起來都較復雜,涉及AI算法,大量的數(shù)據(jù)公式。

給大家解讀一個相對簡單易懂、實用性強的專利。

專利名:具有基于眼睛活動的顯示器操作的電子設備(CN115167664A),該專利提供了一種用于頭顯的眼睛監(jiān)測系統(tǒng),專門檢測用戶的眼睛掃視(saccade)和眨眼。

專利摘要:在掃視和眨眼期間,用戶的視覺靈敏度被暫時抑制。電子設備中的控制電路可利用對用戶的視覺靈敏度的暫時抑制來對顯示器的操作進行調(diào)節(jié)。例如,控制電路可協(xié)調(diào)顯示器的操作與掃視和眨眼所關(guān)聯(lián)的視覺靈敏度抑制時間段,以降低功率消耗和/或進行可能突兀的圖像變化。通過在視覺靈敏度抑制時間段內(nèi)進行調(diào)節(jié),可向電子設備的用戶隱藏這些調(diào)節(jié)。

簡單說,這個技術(shù)方案就是檢測用戶眼部狀態(tài),用算法解析視覺靈敏抑制時間線變化,讓頭顯等設備調(diào)節(jié)畫面亮度時,盡量配合用戶眼部狀態(tài)。

即,盡量不要在用戶眨眼、閉眼時,變化顯示器亮度或者可能突兀的圖像變化。強光、強畫面變化會加劇用戶眼部的不適度。所以要避免!

亮點在哪?

這個專利最大的亮點是如何確定用戶眼睛處于視覺敏度抑制狀態(tài)。

人類眨眼閉合是可以被機器捕捉并觀察的,最后能用數(shù)據(jù)曲線體現(xiàn)。


人類視網(wǎng)膜的光受體分布是不均勻的,因此視敏度隨著與具有最高光受體密度的視網(wǎng)膜位置的距離而下降,該位置通常被稱為中央凹。掃視是快速、急促且大多為彈道式的眼睛旋轉(zhuǎn)。人類每秒進行幾次掃視眼睛運動,以利用視網(wǎng)膜的該最高分辨率部分來觀察所關(guān)注的對象。

眨眼是眼瞼完全或部分地短暫閉合,以清潔、潤濕角膜以及對角膜供氧。眨眼是半自動的行為,大部分是反射性地做出以避免刺激物,或例行地將淚液鋪展在角膜表面上。人類根據(jù)各種條件每分鐘眨眼許多次。

蘋果的工程師就利用上述人類眼睛的特性,通過硬件設備采集用戶眼睛活動如眨眼眼瞼位置變化以及對光亮的反應度,并用算法理解人眼的視覺靈敏抑制期對光的忍耐度,從而調(diào)整顯示設備。

舉個例子,眼瞼完全閉合可導致入射到用戶眼睛視網(wǎng)膜上的光減少500倍以上。眨眼的持續(xù)時間(例如,眼瞼開始其閉合運動和它們完全打開時之間的時間間隔)在約200ms至500ms的范圍內(nèi)。由于眼瞼閉合而造成的光損失可被視為“被動”抑制;用戶的視覺系統(tǒng)在該部分中不發(fā)揮作用,它僅僅是由于光的物理遮擋而發(fā)生的。

除了由于眼瞼閉合而造成的光損失之外,在眨眼事件期間,視覺靈敏度被用戶的大腦主動抑制。

因此,通常存在約100ms-200ms的時間,在此期間,對顯示器的操作的改變可能不會被用戶在視覺上察覺。視覺靈敏度的掃視抑制可在掃視(其可持續(xù)約20至100ms)期間,以及在掃視稍稍前后(例如,在每次掃視前50ms和之后高達200ms)發(fā)生。

眨眼往往以大約每分鐘10-20次眨眼的速率發(fā)生,由于光在眨眼期間被用戶的眼瞼遮擋,可與較強的視覺靈敏度損失相關(guān)聯(lián)。因此,在嘗試對用戶掩蔽可能具有破壞性的顯示器調(diào)節(jié)(例如,在掃視期間可能被感測到的亮度調(diào)節(jié)和其他調(diào)節(jié))時,可能特別有益的是利用眨眼誘發(fā)的視覺靈敏度抑制。

一般來講,控制電路可在與眼睛事件(例如,由系統(tǒng)檢測到的掃視和/或系統(tǒng)檢測到的眨眼)相關(guān)聯(lián)的視覺靈敏度降低的任何適當時間段內(nèi)進行顯示器操作調(diào)節(jié)。

總的來說,這個專利就在講如何根據(jù)眼睛眼瞼閉合張開狀態(tài)來確定用戶的視覺光敏反應度,當用戶處于視覺靈敏抑制狀態(tài),就要對顯示器的亮度、圖像變化進行微調(diào),使其處于低功率狀態(tài),盡量避免影響用戶視覺不適,乃至產(chǎn)生關(guān)聯(lián)的暈動癥、甚至惡心。

【轉(zhuǎn)載請注明德高行·知情郎】

       原文標題 : 蘋果最新專利忙著研究AI圖像合成,視覺靈敏度抑制算法精準獲取人眼疲勞度!

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號