Покращення терміну експлуатації супутникових вбудованих систем за допомогою багатоядерного завдання за допомогою датчика температури

Анотація

1. Вступ

В останнє десятиліття спостерігалося різке зростання космічної галузі; З 2010 по 2015 рік ринок нано/мікросупутників ріс у середньому щорічно на 39%, і очікується, що з 2016 по 2022 рік він буде зростати при річному зростанні 13% [1]. Особливо, попит на малі супутники значно зріс, оскільки космічна галузь перейшла від уряду до приватного ринку. Відповідно до такої зростаючої потреби в невеликих супутниках або космічних місіях, був запроваджений стандарт CubeSat [2] для невеликих супутників вагою близько декількох кілограмів (У стандарті 1 одиниця - це куб 10 см (10 × 10 × 10 см 3) масою не більше 1,33 кг. Супутник може складатися з одного (1U) або декількох кубів (3U, 6U, 12U та 27U).). Хоча спочатку CubeSats були розроблені для навчальних або демонстраційних цілей, їх використання було поширено на більш загальні та вдосконалені місії, включаючи наукові програми, дослідження глибокого космосу тощо [3].

Хоча супутникові системи піддаються екстремальним умовам з точки зору випромінювання та температури, очікується, що вони працюватимуть тривалий час без технічного обслуговування. Більше того, місії, накладені на такі невеликі супутники, з часом стають все більш серйозними. Іншими словами, вимоги до продуктивності або надійності бортового комп'ютера супутникових систем продовжують зростати. Таким чином, типовим є проектування супутникової системи із зміцненими радіацією процесорами [4], які, як правило, мають нижчі показники, ніж звичайні. Для того, щоб одночасно задовольнити вимоги надійності та продуктивності, було запропоновано перенастроюваний обчислювальний підхід із програмованими на місцях воротами (FPGA), де можуть бути включені різні техніки відмовостійкості [5,6,7].

Оскільки CubeSats піддаються багатьом фізичним обмеженням, включаючи обсяг і вагу, важко розгорнути великі батареї або сонячні батареї. Типові CubeSats із встановленими на корпусі сонячними панелями генерують менше 10 Вт, а найсучасніші сонячні панелі, що розгортаються, виробляють 20–30 Вт. Акумулятори, що використовуються в CubeSats, зазвичай зберігають лише 14–30 Вт · год [8]. Наприклад, у SwissCube [9] середня потужність, вироблена від сонячних панелей на орбіту, становить лише 1,5 Вт. Такий обмежений енергетичний бюджет може обмежити продуктивність бортових обчислень. Як задовольнити зростаючий попит на продуктивність та надійність в рамках даного бюджету електроенергії - це проблема.

Надійність - одна з ключових проблем дизайну супутника. Більшість космічних місій вимагають тривалого життя. Загалом супутники з низькою орбітою Землі (LEO), як правило, мають менший очікуваний час життя (5–10 років), ніж супутники геостаціонарної орбіти (GEO) (15 років і більше). Оскільки технічне обслуговування в супутникових системах є фізично неможливим, дуже важливо розробити їх для роботи протягом тривалого терміну служби без будь-яких збоїв. Ефект теплового циклізму (TC), який досвід супутників при екстремальних перепадах температури є однією з основних загроз надійності. Наприклад, у LEO CubeSat (SwissCube) зовнішня температура змінюється від 30 ∘ C до −30 ∘ C, як показано на малюнку 1 [10]. Для того, щоб зберегти систему неушкодженою при сильних зовнішніх перепадах температури, на супутниках високого класу застосовується багато фізичних захистів, включаючи терморегулювання, багатошарову ізоляцію, сонячні екрани, радіатори, теплові труби тощо. Однак для невеликих супутників, таких як CubeSats, важко повністю забезпечити такий фізичний захист через вартість та фізичні обмеження.

покращення

Вимірювання температури в SwissCube [10] (BAT: акумулятор, EXT: зовнішній, друкована плата: друкована плата та MB: материнська плата).

У цій роботі, натхненний тим фактом, що більшість малих супутників оснащені датчиками температури, ми намагаємося збільшити термін служби малих супутникових систем, які розроблені з багатоядерними процесорами без фізичного захисту, регулюючи багатоядерну конфігурацію за температури -свідомий спосіб. Наразі більшість методів підвищення надійності намагаються підтримувати робочу температуру якомога нижчою [11,12,13], оскільки загальновідомо, що високі температури призводять до низької надійності. Однак у супутникових системах це може бути не так, оскільки зовнішня температура сильно змінюється, як показано на малюнку 1. Тобто в деяких випадках штучні зусилля щодо зниження температури стружки можуть скоріше мати негативний ефект від збільшення амплітуди ТК.

Для підвищення надійності роботи з урахуванням цього ефекту TC ми пропонуємо розумно відрегулювати відображення навантаження програмного забезпечення на декілька ядер та робочу частоту ядер таким чином, щоб мінімізувати амплітуду TC. Крім того, ми вводимо в систему віртуальне робоче навантаження, якщо для збільшення надійності потрібно витратити більше енергії. Роблячи це, плануваність планування місій супутників та обмеження потужності у реальному часі все одно повинна бути задоволена.

Наші внески можна резюмувати наступним чином:

ми виявляємо аномалію життя, коли нижчі температури призводять до ще гіршого очікуваного терміну життя в супутникових системах;

тоді для пом'якшення ефектів TC, визначених вище, ми пропонуємо техніку відображення/присвоєння частоти для багатоядерних супутникових систем.

У запропонованій техніці ми націлені на супутникові системи, реалізовані поверх однорідної багатоядерної системи, де кожне ядро ​​може мати незалежну конфігурацію частоти/напруги (Хоча багато комерційно доступних багатоядерних платформ підтримують лише модуляцію частоти та напруги кластерного рівня, існують такі гнучкі системи [14] та інші методи підвищення надійності, включаючи [15], також націлені на ту саму архітектуру.). В якості робочого навантаження ми припускаємо, що програмне забезпечення супутників реалізоване як набір періодично викликаних завдань у режимі реального часу. Для того, щоб забезпечити швидку, але точну оцінку температури, ми припускаємо, що час виконання завдання є достатньо довгим, щоб досягти стабільної температури. Ми вважаємо це припущення обґрунтованим завдяки низькому енергоспоживанню супутникових систем. Неточність, яка може бути спричинена цим, проаналізована в розділі 4.4. Для кількісної оцінки надійності системи ми приймаємо модель, запропоновану Xiang et al. [16], де термін служби визначається на основі часового температурного профілю. Розгляд впливу просторових градієнтів температури на надійність залишається майбутньою роботою.

Решта цього документу організована таким чином: У наступному розділі ми обговоримо відповідні роботи та те, чому існуючі методи неефективні в супутникових системах. Розділ 3 кількісно визначає запропоновану проблему із завданнями, архітектурою, моделями потужності/температури та надійності. Розділ 4 описує наш метод для досягнення тривалості надійності багатоядерних вбудованих систем LEO із супутником у три етапи. Оцінки проводяться в моделюванні в Розділі 5, щоб показати, як запропонована техніка покращує надійність протягом усього життя, а потім заключні зауваження та майбутні роботи в Розділі 6.

2. Пов’язана робота

На додаток до ефекту TC, який ми в основному розглядаємо в цій роботі, існують ще три відомі причини відмов в інтегральних схемах CMOS (ІС): електроміграція (ЕМ), залежність від часу діелектричного пробою (TDDB) і міграція напружень (SM) [17]. Кожен із цих механізмів відмов кількісно визначається середнім часом до відмови (MTTF), що є очікуваним терміном служби щодо джерела відмови [18]. Більшість існуючих робіт були зосереджені на кожній із вищезазначених причин окремо, наприклад, EM [18,19,20], TDDB [18,21], SM [18] та TC [18,22]. Оскільки ці причини фізично співіснують у роботі ІС, важливо розглядати їх одночасно. Срінвасан та ін. [23] запропонував модель з урахуванням надійності мікропроцесора (RAMP) з нестабільністю температури негативного зміщення (NBTI) на додаток до чотирьох вищезазначених причин. П'ять різних причин відмов визначаються кількісно з точки зору надійності за допомогою моделі суми відмов (SOFR), в якій передбачається, що кожен механізм відмов пов'язаний з постійною частотою відмов. Сян та ін. [16] запропонував модель надійності на рівні системи з EM, TDDB, SM та TC на основі моделювання Монте-Карло.