Оптимизация решателя судоку на Haskell

Я написал решатель судоку на Haskell. Он проходит по списку, и когда он находит «0» (пустую ячейку), он получает числа, которые могут поместиться, и пробует их:

import Data.List (group, (\\), sort)
import Data.Maybe (fromMaybe)

row :: Int -> [Int] -> [Int]
row y grid = foldl (\acc x -> (grid !! x):acc) [] [y*9 .. y*9+8]
    where y' = y*9
column :: Int -> [Int] -> [Int]
column x grid = foldl (\acc n -> (grid !! n):acc) [] [x,x+9..80]
box :: Int -> Int -> [Int] -> [Int]
box x y grid = foldl (\acc n -> (grid !! n):acc) [] [x+y*9*3+y' | y' <- [0,9,18], x <- [x'..x'+2]]
    where x' = x*3

isValid :: [Int] -> Bool
isValid grid = and [isValidRow, isValidCol, isValidBox]
    where isValidRow = isValidDiv row
          isValidCol = isValidDiv column
          isValidBox = and $ foldl (\acc (x,y) -> isValidList (box x y grid):acc) [] [(x,y) | x <- [0..2], y <- [0..2]]
          isValidDiv f = and $ foldl (\acc x -> isValidList (f x grid):acc) [] [0..8]
          isValidList = all (\x -> length x <= 1) . tail . group . sort -- tail removes entries that are '0'

isComplete :: [Int] -> Bool        
isComplete grid = length (filter (== 0) grid) == 0

solve :: Maybe [Int] -> Maybe [Int]
solve grid' = foldl f Nothing [0..80]
    where grid = fromMaybe [] grid' 
          f acc x
            | isValid grid = if isComplete grid then grid' else f' acc x
            | otherwise    = acc
          f' acc x 
            | (grid !! x) == 0 = case guess x grid of 
                Nothing -> acc
                Just x -> Just x
            | otherwise        = acc

guess :: Int -> [Int] -> Maybe [Int]
guess x grid
    | length valid /= 0 = foldl f Nothing valid
    | otherwise         = Nothing
    where valid = [1..9] \\ (row rowN grid ++ column colN grid ++ box (fst boxN) (snd boxN) grid) -- remove numbers already used in row/collumn/box
          rowN = x `div` 9 -- e.g. 0/9=0 75/9=8
          colN = x - (rowN * 9) -- e.g. 0-0=0 75-72=3
          boxN = (colN `div` 3, rowN `div` 3)
          before x = take x grid
          after x = drop (x+1) grid
          f acc y = case solve $ Just $ before x ++ [y] ++ after x of
            Nothing -> acc
            Just x -> Just x

Для некоторых головоломок это работает, например вот эта:

sudoku :: [Int]
sudoku = [5,3,0,6,7,8,0,1,2,
          6,7,0,0,0,0,3,4,8,
          0,0,8,0,0,0,5,0,7,
          8,0,0,0,0,1,0,0,3,
          4,2,6,0,0,3,7,9,0,
          7,0,0,9,0,0,0,5,0,
          9,0,0,5,0,7,0,0,0,
          2,8,7,4,1,9,6,0,5,
          3,0,0,2,8,0,1,0,0]

Потребовалось меньше секунды, но вот этот:

sudoku :: [Int]
sudoku = [5,3,0,0,7,0,0,1,2,
          6,7,0,0,0,0,3,4,8,
          0,0,0,0,0,0,5,0,7,
          8,0,0,0,0,1,0,0,3,
          4,2,6,0,0,3,7,9,0,
          7,0,0,9,0,0,0,5,0,
          9,0,0,5,0,7,0,0,0,
          2,8,7,4,1,9,6,0,5,
          3,0,0,2,8,0,1,0,0]

Я не видел финиша. Я не думаю, что это проблема с методом, так как он возвращает правильные результаты.

Профилирование показало, что больше всего времени проводилось в функции «isValid». Есть ли что-то явно неэффективное/медленное в этой функции?


person matio2matio    schedule 20.02.2012    source источник


Ответы (2)


Реализация конечно поправима, но проблема не в этом. Проблема в том, что для второй сетки простой алгоритм «угадай и проверь» требует много обратного отслеживания. Даже если вы ускорите каждую из ваших функций в 1000 раз, будут сетки, где для нахождения (первого, если сетка не уникальна) все равно потребуется в несколько раз возраст Вселенной.

Вам нужен лучший алгоритм, чтобы избежать этого. Довольно эффективный способ избежать таких случаев — сначала угадать квадрат с наименьшим количеством возможностей. Это не позволяет избежать всех плохих случаев, но значительно уменьшает их.

Одна вещь, которую вы также должны сделать, это заменить проверку length thing == 0 на null thing. С относительно короткими списками, встречающимися здесь, эффект ограничен, но в целом он может быть драматичным (и вообще вы также не должны использовать length list <= 1, вместо этого используйте null $ drop 1 list).

person Daniel Fischer    schedule 20.02.2012

isValidList = all (\x -> length x <= 1) . tail . group . sort -- tail removes entries that are '0'

Если исходный список не содержит нулей, tail удалит что-то еще, возможно, список из двух единиц. Я бы заменил tail . group. sort на group . sort . filter (/= 0).

Я не понимаю, почему isValidBox и isValidDiv используют foldl, поскольку map кажется адекватным. Я что-то пропустил / они делают что-то ужасно умное?

person dave4420    schedule 20.02.2012