Рассматриваются основные способы теплового моделирования микросхем в корпусах типа BGA, LGA и PGA, описываются соответствующие им тепловые модели (CTM и DTM), сравниваются их преимущества и недостатки. Приводится подробное описание способа теплового моделирования с использованием детализированных тепловых модлей (DTM) разных типов – с усреднённым и детализированным источником тепла.

При тепловом моделировании средств современной электроники часто возникает задача построения тепловой модели и расчёта нагрева микросхем в корпусах BGA, LGA и PGA. Такие микросхемы присутствуют практически в любом сложном электронном изделии – это могут быть процессоры, мосты, микросхемы маршрутизаторов, чипы оперативной памяти и т.д. Как правило, это наиболее важные функциональные компоненты в устройстве, обеспечение безотказной работы которых (в том числе и  правильных тепловых режимов работы) критически важно для работоспособности всего изделия. Такие микросхемы имеют достаточно сложную структуру, высокую мощность тепловыделения и высокие плотности тепловых потоков, что делает задачу их моделирования важной, и вместе с тем нетривиальной. Успешность её решения во многом зависит от точности используемой тепловой модели. Проводится описание и сравнение некоторых видов тепловых моделей BGA микросхем с указанием их достоинств и недостатков.

Постановка задачи и методы моделирования

Существует несколько методов теплового моделирования микросхем, характеризующихся разной точностью, сложностью, применимостью в той или иной расчётной САПР и т.д. Используемые методы моделирования и тепловые модели делятся на два больших класса – детализированные тепловые модели (DTM - Detailed Thermal Model) и компактные тепловые модели (CTM – Compact Thermal Model).

В модели DTM c разной степенью детализации воспроизводится реальная физическая структура микросхемы. Такая модель является наиболее точной, и чем детальнее воспроизводится реальная структура чипа, тем точнее получается результат моделирования.

Модели CTM в общем случае не требуют обязательной привязки к реальной структуре микросхем, однако для их интеграции и использования в тепловых моделях всего изделия такая привязка бывает необходимой. CTM представляет собой идеализацию структуры микросхемы в виде цепочки или сети тепловых сопротивлений. В простейшем случае она представляет собой двухрезисторную тепловую модель (two-resistor CTM), в более продвинутом – сеть тепловых сопротивлений (DELPHI CTM) [1]. Компактные модели более просты, требуют существенно меньше вычислительных ресурсов, однако при этом менее точны (иногда – существенно) и хорошо подходят главным образом для типовых сценариев использования микросхем в электронике.  DELPHI CTM модели в меньшей степени подвержены обозначенным выше недостаткам и являют собой прекрасный компромисс простоты, удобства использования и точности.

В настоящей статье не рассматриваются особенности моделирования с использованием компактных тепловых моделей т.к. в рамках такого подхода у инженера-расчётчика не остаётся пространства для манёвра в настройках и модификации модели, равно как и возможностей совершить ошибку.

Выбор способа моделирования, как правило, зависит не столько от желания и способности инженера-расчётчика подобрать оптимальный способ для данного случая, сколько от доступности информации о тепловых характеристиках микросхемы. К сожалению, не всегда эта информация доступна в необходимом объёме. Также возможны ситуации, когда производитель микросхемы предоставляет сложную DELPHI CTM-модель, а в используемой на предприятии расчётной САПР такие модели не поддерживаются (как, например, в SolidWorks flowSimulation). В таких случаях у расчётчика есть возможность повысить точность теплового моделирования, доступную для двухрезисторной модели (данные для которой доступны практически всегда) построением собственной DTM-модели, пусть и не самой высокой степени детализации микросхемы.

О некоторых особенностях использования и построения DTM моделей для BGA (а также LGA и PGA) микросхем и пойдёт речь далее, хотя стоит заметить, что аналогичный подход может быть применим и для других типов корпусов. Главное условие – знание структуры и тепловых свойств материалов микросхемы.

Общая стратегия моделирования с использованием собственной DTM-модели будет следующей:

  1. построение двухрезисторной модели и использование полученных на ней результатов в качестве грубой оценки (погрешность расчёта на двухрезисторной модели может доходить до 30% [2]);
  2. дальнейшее уточнение расчёта на детализированной модели (DTM).

Стоит отдельно заметить, что двухрезисторная модель даёт усреднённое значение температуры по кристаллу – т.е. если зоны нагрева распределены по кристаллу неравномерно, локализованы на какой-то его части, двухрезисторная модель может давать заниженные значения.

Описание структуры BGA микросхемы. 

В самом общем и упрощённом виде структуру интегральной микросхемы в корпусе типа BGA можно описать следующим образом – непосредственно кристалл микросхемы (die) закрепляется тем или иным способом на подложке (substrate), на которой в свою очередь расположен массив шариков припоя (solder balls), посредством которых корпус с микросхемой монтируется на печатную плату изделия.
Кристалл микросхемы может быть дополнительно закрыт корпусом или оставлен открытым. Способов крепления кристалла к подложке также существует несколько [3-4]. Все эти особенности влияют на параметры тепловой модели и должны учитываться при её построении. Для примера на рисунке 1 приведена структура FC-BGA корпуса с закрытым крышкой кристаллом, прикреплённым к подложке по технологии flip-chip, который часто используется для современных микропроцессоров.

Главными компонентами корпуса являются:

  • шарики припоя (solder balls) или сокет;
  • подложка (substrate);
  • бампы (bumps);
  • кристалл (die);
  • термоинтерфейс (TIM);
  • крышка корпуса (LID).

picture 1 Microchip structure in FC BGA packageРисунок 1 - Структура микросхемы в корпусе FC-BGA 

Корпуса PGA и LGA имеют похожую структуру, с той лишь разницей, что их монтаж на материнской плате осуществляется не пайкой, а установкой в сокет, соответственно, вместо шариков припоя на корпусе микросхемы размещены контактные площадки или ножки.

Особенности построения детализированной тепловой модели.

В геометрии тепловой модели воспроизводятся главные структуры микросхемы: кристалл, подложка, шарики припоя и крышка. Термоинтерфейс и бампы целесообразнее представить в виде контактного теплового сопротивления из-за очень малой толщины этих структур по сравнению с другими структурами микросхемы.

Стоит заметить, что в такой модели не учитывается в полной мере сложная структура подложки и кристалла. В самом простом случае они задаются материалом с ортотропными свойствами – усреднёнными значениями теплопроводности в направлении вдоль и поперёк плоскости.

Наибольшее влияние на точность модели оказывает точное задание области тепловыделения на кристалле. В самом общем случае, когда о структуре кристалла нет никакой информации, приходится задавать тепловыделение по всему объему или всей лицевой поверхности. Физически микроструктуры элементов схемы кристалла расположены в достаточно тонком (в 100 раз тоньше, чем толщина кристалла [5]) слое кремния, поэтому правильнее задавать мощность планарным тепловым источником.

Как правило, у сложных микросхем кристалл выделяет тепло неравномерно – есть локальные зоны, типа вычислительных ядер, на которых выделяется практически вся мощность, в то время как на остальной части кристалла тепловыделение практически отсутствует. В детализированных тепловых моделях от производителей микросхем этот момент обязательно учитывается, однако даже если такая модель недоступна, можно учесть его на основе открытых данных о структуре ядра.  Пример такой локализации для процессора Intel Core i7 показан на рисунке 2, который размещён на сайте Intel [6].

picture 2 7th Gen Intel Core desktop processorРисунок 2 - 7th Gen Intel Core desktop processor - карта структуры кристалла

Далее проводится сравнение двух типов детализированных моделей – с усреднённым тепловым источником и с локализованным тепловым источником.

Общий подход к моделированию, граничные условия и параметры модели.

Для моделирования нагрева микросхемы помимо информации о структуре микросхемы, мощности тепловыделения и характере теплового источника, необходимо знать, в каких внешних условиях работает микросхема, т.е. как она установлена на материнскую плату и какими параметрами обладает используемая система охлаждения.

Для сравнения методик в настоящем документе берётся случай микросхемы процессора, установленного на серверную материнскую плату с системой охлаждения, которая представляет собой радиатор, обдуваемый потоком воздуха определённой скорости. Скорость потока воздуха полагалась равной 5 м/с, а его температура – 20 °С. Эти величины соответствуют типичным характеристикам систем охлаждения в современных дата-центрах. Мощность процессора составляет 50 Вт.

Поскольку в данной задаче моделируется непосредственно процессор, вне системы (сервера), для упрощения расчёта берётся небольшой фрагмент материнской платы вокруг процессора, помещённый в условный корпус, ограничивающий воздушный поток таким образом, что имитируются условия, типичные для обычного 1U вычислительного сервера. Общий вид тепловой модели показан на рисунке 3.

picture 3 General view of the modelРисунок 3 – Общий вид модели

Детализированная тепловаая модель с усредненным источником.

Согласно рассматриваемой методике, тепловая модель строится следующим образом. Задаются геометрические примитивы в виде параллелепипедов, имитирующие главные элементы структуры микросхемы. Для каждого такого примитива задаётся материал с соответствующими свойствами теплопроводности и теплоёмкости, для некоторых структур, например, подложки – с ортотропными. Далее задаётся тепловой источник – в данном случае объёмный, на весь кристалл, или поверхностный, на всю площадь нижней поверхности кристалла (см. рисунок 4).

picture 4 model of the processor in the LGA package installed in the socketРисунок 4 - модель процессора в корпусе LGA, установленного в сокет

Главный недостаток такой модели, как уже было замечено, усреднённое распределение тепловыделения на кристалле – мощность тепловыделения в реальном кристалле распределена неравномерно по его поверхности. На кристалле имеются горячие участки, соответствующие, например, вычислительным ядрам, которые выделяют большую часть мощности. Таким образом, усреднение тепловыделения по всему кристаллу занижает максимальную температуру нагрева, что приводит к неверной оценке эффективности охлаждения микросхемы и неверной оценке работоспособности изделия при определённых условиях (как правило, при повышенных температурах) окружающей среды. Фактически, такие расчёты дают слишком оптимистичный результат, что в реальности может привести к использованию недостаточно эффективной системы охлаждения и перегреву изделия. Зная о таком недостатке модели, разработчик вынужден завышать параметры системы охлаждения, что, в общем случае, ухудшает характеристики изделия – увеличиваются его вес, габариты, уровень шума и пр.

picture 5 the average heat source the temperature on the substrate and the surface of the crystalРисунок 5 - Усреднённый тепловой источник. Температура на подложке и поверхности кристалла

На рисунке 5 показано распределение температур на поверхности подложки, в том числе и в зоне контакта с кристаллом, т.е. в зоне расположения теплового источника (зоне максимального нагрева). Видно, что нагрев практически равно

мерный, без каких-либо горячих областей. В результате моделирования с заданными условиями установлено, что максимальная температура кристалла процессора составляет 38 °С, и она равна средней температуре кристалла.

Детализированная модель с детализированным источником

Детализированная модель в общем повторяет предыдущую, с усреднённым источником, за исключением её главного недостатка. Теперь тепловыделение задаётся только в тех зонах кристалла и в таком объёме, где оно действительно присутствует. В данном случае зона активного тепловыделения расположена на части кристалла процессора, соответствующей вычислительным ядрам, и находится в рамках прямоугольника, как показано на рисунке 6. Соответственно, в тепловой модели мощность задаётся поверхностным источником на нужную область.

picture 6 heat generation area in the processor chipРисунок 6 - Область тепловыделения на кристалле процессора

Согласно результатам детализированного моделирования средняя температура кристалла осталась равной 38 °С, а максимальная температура составляет уже 46 °С! На рисунке 7 хорошо видно, что, нагрев распределяется неравномерно, и на кристалле есть горячие области.

picture 7 detailed heat source the temperature on the substrate and the surface of the crystalРисунок 7 - Детализированный тепловой источник. Температура на подложке и поверхности кристалла 

Заключение

Сравнение двух способов показывает, что детализированная модель с усреднённым тепловым источником даёт более оптимистичный результат, чем есть на самом деле, если структура тепловыделения кристалла микросхемы неравномерна, и тепловыделение сконцентрировано зонально. В худшем случае такая неверная оценка может привести к выбору недостаточно эффективной системы охлаждения и неработоспособности изделия из-за перегрева. При этом, даже зная такой недостаток методики, сложно достоверно оценить ошибку, что в свою очередь вынуждает делать оценку с запасом, и выбирать избыточную по характеристикам систему охлаждения. К достоинствам модели с усреднённым тепловым источником можно отнести её простоту.

В случае, когда структура микросхемы и характер теплового источника известны, для расчётов стоит применять более точную модель с детализированным источником тепла. Её несомненным преимуществом является более точная оценка нагрева микросхемы, а значит, и возможность спроектировать оптимальную по характеристикам и эффективную систему охлаждения.

Сисок литературы

  1. DELPHI COMPACT THERMAL MODEL GUIDELINE http://www.simu-cad.com/userfiles/images/ZaiXianXiaZai/8642da64c6394e3c8bf10ed2445ed914.pdf
  2. Compact thermal modeling in electronics design https://www.electronics-cooling.com/2007/05/compact-thermal-modeling-in-electronics-design/
  3. Fundamentals of semiconductor manufacturing and process control / Gary S. May, Costas J. Spanos. ISBN-13: 978-0-471-78406-7
  4. Packaging technology for Image-processing LSI https://www.fujitsu.com/global/documents/about/resources/publications/fstj/archives/vol49-1/paper21.pdf
  5. Коледов Л.А. Технология и конструкция микросхем, микропроцессоров и микросборок. Изд. Радио и связь. 1989.
  6. https://newsroom.intel.com/press-kits/7th-gen-intel-core/

  

Скачать в формате pdf