Задача #3886

Анализ данных

Уровень ЕГЭ

Фрагмент звёздного неба спроецирован на плоскость с декартовой системой координат. Учёный решил провести кластеризацию полученных точек, являющихся изображениями звёзд, то есть разбить их множество на N непересекающихся непустых подмножеств (кластеров), таких что точки каждого подмножества лежат внутри прямоугольника со сторонами длиной H и W, причём эти прямоугольники между собой не пересекаются. Стороны прямоугольников не обязательно параллельны координатным осям.
Гарантируется, что такое разбиение существует и единственно для заданных размеров прямоугольников.

Будем называть центром кластера точку этого кластера, сумма расстояний от которой до всех остальных точек кластера минимальна. Для каждого кластера гарантируется единственность его центра. Расстояние между двумя точками на плоскости A(x1,y1) и B(x2,y2) вычисляется по формуле: d(A,B)=(x2x1)2+(y2y1)2

Каждая звезда помимо координат на плоской карте характеризуется своим спектральным классом и классом светимости. Спектральный класс определяет цвет (который связан с температурой звезды) согласно таблице. Каждый из спектральных классов, в свою очередь, делится на подклассы от 0 до 9 в порядке уменьшения температуры. Обозначение подкласса ставится после обозначения спектрального класса (например, B2). Класс светимости звезды обозначим римскими цифрами от I до VII.

Обозначение Цвет Обозначение Размер
G белый I сверхгигант
J зелёный II яркий гигант
L синий III гигант
N оранжевый IV субгигант
Y красный V карлик
S голубой VI субкарлик
Z жёлтый VII белый карлик

В файле A хранятся данные о звёздах двух кластеров, где H=6,5, W=4,5 для каждого кластера. каждой строке записана информация о расположении на карте одной звезды: сначала координата x, затем координата y. Далее в той же строке для звёзд классов светимости I–VI указываются спектральный класс, подкласс и класс светимости. Обозначения классов ничем не разделяются. Для звёзд класса светимости VII (Белый карлик) обозначения спектрального класса и подкласса в файле не указываются. Известно, что количество точек не превышает 1000.

В файле B хранятся данные о звёздах трёх кластеров, где H=6,5, W=5 для каждого кластера. Известно, что количество звёзд не превышает 10 000. Структура хранения информации о звездах в файле B аналогична файлу А.

Для файла А определите координаты центра каждого кластера, затем найдите два числа: A1 – минимальное расстояние от оранжевого сверхгиганта подкласса 9 до центра кластера, и A2 – максимальное расстояние от оранжевого сверхгиганта подкласса 9 до центра кластера. Гарантируется, что оранжевый сверхгигант подкласса 9 единственный.

Для файла Б определите координаты центра каждого кластера, затем найдите два числа: B1 – в кластере с наибольшим количеством точек число звёзд с подклассом больше 7, и B2 – в кластере с средним количеством точек число звёзд с подклассом менее 4.

В ответе запишите четыре числа: в первой строке – сначала целую часть произведения A1 × 10 000, затем целую часть произведения A2 × 10 000; во второй строке – сначала значение B1, затем значение B2.


Внимание! График приведён в иллюстративных целях для произвольных значений, не имеющих отношения к заданию.
Для выполнения задания используйте данные из прилагаемого файла.

Ответ
Вопрос A
Вопрос B
Войдите, чтобы история ответов и статистика сохранялись.
Решение Нажми, чтобы открыть

Ответ

Вопрос A
1600
68648
Вопрос B
77
28
A = [[],[]]

for s in open('27_A.txt'):
x,y,t = s.replace(',','.').split()
x,y = float(x), float(y)
if t=='VII': t=' VII'
if y>10: A[0].append([x,y,t])
else: A[1].append([x,y,t])

B = [[],[],[]]

for s in open('27_B.txt'):
x,y,t = s.replace(',','.').split()
x,y = float(x), float(y)
if t=='VII': t=' VII'
if y>23: B[0].append([x,y,t])
elif y>15: B[1].append([x,y,t])
else: B[2].append([x,y,t])

def dist(p1,p2):
x1,y1,t1 = p1
x2,y2,t2 = p2
return ((x2-x1)**2 + (y2-y1)**2)**0.5

def centr(cl):
m = []
for p in cl:
s = sum(dist(p,p1) for p1 in cl)
m.append([s,p])
return min(m)[1]
c0 = centr(A[0])
c1 = centr(A[1])
x = [p for p in A[0]+A[1] if p[2]=='N9I'][0]
A1 = int(min(dist(c0,x), dist(c1,x))*10000)
A2 = int(max(dist(c0,x), dist(c1,x))*10000)
print(A1,A2)

#print([len(cl) for cl in B])
B1 = len([p for p in B[2] if p[2][1]!=' ' and int(p[2][1])>7])
B2 = len([p for p in B[1] if p[2][1]!=' ' and int(p[2][1])<4])
print(B1, B2)
Быстрый переход
Перейти к задаче