Противоречивый вывод решателя CVXPY

Я знаком с CVXPY и столкнулся со странной проблемой. У меня есть следующая простая задача оптимизации игрушки:

import numpy as np
import cvxpy as cp

A=np.array([[1,0,0],[0,1,0], [0,0,1]])
y=np.array([1,1,1])

# Upper bound for the constraint term
upper=1
# Solve the optimization problem using CVXPY
x = cp.Variable(3)
objective = cp.Minimize(cp.sum_squares(x))
constraint = [cp.sum_squares(A*x - y) <= upper]
prob = cp.Problem(objective, constraint)
prob.solve()
optimal_x = x.value

print('Value of constraint at optimal x:' + str(np.linalg.norm(A*optimal_x - y)**2))

Теперь я ожидаю, что мой выходной номер будет больше, чем upper=1, но я получаю следующее:

Value of constraint at optimal x:3.0000000068183947

Я очень не понимаю, как это могло быть правдой. Я неправильно использую функцию cp.sum_squares? Я просто неправильно настраиваю оптимизацию? Любая помощь приветствуется !!


person Longti    schedule 26.12.2018    source источник


Ответы (1)


Я думаю, что путаница связана с неправильным умножением матриц в numpy:

>>> A * optimal_x - y
array([[-0.57735027, -1.        , -1.        ],
       [-1.        , -0.57735027, -1.        ],
       [-1.        , -1.        , -0.57735027]])

Где на самом деле, я думаю, ты хочешь

>>> np.dot(A, optimal_x) - y
array([-0.57735027, -0.57735027, -0.57735027])

Что действительно не нарушает ограничение (в пределах ошибок округления):

>>> np.linalg.norm(np.matmul(A, optimal_x) - y) ** 2
1.000000002699704

Также см. этот вопрос для справки по умножению матрицы на массив в numpy.

Это действительно сбивает с толку, потому что объекты CVXPY правильно обрабатывают оператор * даже с несколькими типами:

>>> (A * x - y).value
array([-0.57735027, -0.57735027, -0.57735027])

Также обратите внимание, что для любого дерева выражений, которое вы создаете в CVXPY, после оптимизации вы можете запросить значение этого выражения с учетом оптимизированного значения x:

>>> cp.sum_squares(A*x - y).value
array(1.)
person andersource    schedule 26.12.2018